来看看 发表于 2018-10-28 08:03:56

写给MongoDB开发者的50条建议Tip7

  本系列文章翻译自《50 Tips and Tricks for MongoDB      Developers》,暂时没有找到中文版,反正自己最近也在深入学习mongodb,所以正好拿来翻译一下。一方面加强自己学习的效果,另一方面让大   家也一起来体验一下需要我们这些mongodb使用者需要注意的地方。
  首先声明自己的英文水平不是太高,加之有些英文翻译成中文也找不到合适的词来表达,所以在文章中可能会出现英文原词,或者说有些地方的翻译会有些生         硬,也就是说会出现直译的地方。翻译该书的主要目的是为大家学习探讨用的,如果有翻译不精准的地方,或者说有更加精准的翻译,还请大家指出,我会及时的更   正的,在此先谢过各位了。
  Tip#7.Pre-populate anything you can
  

  预先填充你能填充的

  如果你知道,在将来,你的文档中肯定会需要一些字段,在你插入文档的时候就填充它们,而不是在需要它们的时候在创建,会更高效。例如,你正在创建一个站点分析的应用,可以查看一天中有每一页都有多少用户访问。你会有一个pages collection,每个document记录在过去的6个小时中,每分钟和每小时的访问量。
  


[*]{
[*]"_id":pageId,
[*]"start":time,
[*]"visits":{
[*]    "minutes":[
[*]      ,
[*]      ,
[*]      ,
[*]      ,
[*]      ,
[*]      
[*]    ],
[*]    "hours":
[*]}
[*]}
  

  这么做有一个优势,就是我们知道从现在到某一个时间点文档会是什么样子。是一个从现在开始,在接下来的6个小时,每分钟和每小时的访问量。后面的6个小时又会是一个新的文档。
  因此,我们需要一个批量处理的任务,在空闲的时候,或者是在一天的固定时间,插入这些模板文档。插入的模板应该是下面的样子。
  


[*]{
[*]"_id":pageId,
[*]"start":someTime,
[*]"visits":{
[*]    "minutes":[
[*]      ,
[*]      ,
[*]      ,
[*]      ,
[*]      ,
[*]      
[*]    ],
[*]    "hours":
[*]}
[*]}
  

  现在,当你增加这些计数器的时候,mongodb不需要为他们现去分配空间。只是更新已经插入的文档的值,这么做速度会更快。
  例如,在刚开始的一个小时,你只需要这么做。
  


[*]db.page.update({"_id":pageId,"start":thisHour},{"$inc":{"visits.0.0":3}})
  

  这种做法也可以扩展到集合和数据库的其他类型数据,如果你每天需要一个新的集合,最好预先创建他们。


页: [1]
查看完整版本: 写给MongoDB开发者的50条建议Tip7