huiselele 发表于 2017-12-15 11:52:39

mongodb新人扫盲


[*]前言
[*]数据库基本命令
[*]集合(表)命令
[*]增加数据
[*]删除数据
[*]更新数据

[*]使用update()更新
[*]使用save()命令实现upsert
[*]自动更新信息

[*]查询数据
[*]aggregate
[*]$group
[*]$sum
[*]$limit
[*]$match
[*]$sort
[*]$unwind
[*]$project
[*]$skip
[*]mongoose的使用
前言


[*]mongodb是什么?, 需fq
[*]如何安装mongodb?
数据库基本命令


[*]  显示所有数据库: show dbs

[*]  创建/使用数据库:use dbName

[*]  创建数据库表,在mongoDB里又将表称为集合(collections), 因此创建表:db.createCollection("collectionName")

[*]  显示数据库下的所有集合(表): show tables / show collections

[*]  删除当前数据库: db.dropDatabase()

[*]  查看当前所使用的数据库: db.getName()

[*]  显示当前数据库的状态: db.stats()

[*]  显示当前数据库的版本: db.version()

[*]  注意: collection和table概念差不多,doc和row概念差不多。

集合(表)命令

增加数据


[*]  创建一个集合: db.createCollection("tableName")

[*]  添加文档:

  

db.tableName.insert({username: "john", age: "18"})  

  
// 或者
  
db.tableName.save({username: "john", age: "18"});
  

  
// 它们之间的区别
  

  
// 1. 使用save,如果对象不存在则插入,如果存在,则会调用update方法。如果是insert,或忽略调用update方法。
  

  
// 2. insert可以插入一个列表,而不用遍历,效率高。而save需要遍历,效率不如insert。
  

删除数据


[*]删除操作: db.tableName.remove({age: 18})
更新数据

使用update()更新
  

db.tableName.update({age: 18}, {$inc: {age:10}}, false ,true)  

  
// 等价于
  
update tableName set age = age + 10 where age = 18;
  

  
// 关于update
  
db.collection.update(
  <query>,
  <update>,
  {
  upsert: <boolean>,
  multi: <boolean>
  }
  
);
  

  
// {}里的是可选的
  
// upsert为true表示如果记录存在就更新,不存在就插入新的记录。
  
// multi为true表示更新所有匹配的文档,如果为false表示只更新第一个文档(默认行为)。
  

使用save()命令实现upsert
  

// 如果不指定'_id'值,save()命令会认为它是一个插入操作。  
// 如果指定,就是更新。
  

  
db.calendars.save({'uid': 'yuzf', 'projectId': 'test'}); // 插入一条数据
  
db.calendars.save({'_id': 'test', 'uid': 'yuzf', 'projectId': 'test'}); // 更新一条数据
  

自动更新信息
  

// 将name为yuzf的人的成绩加4,如果存在就更新,不存在就创建。  
db.stu.update({'name': 'yuzf'}, {$inc: {grade: 4}}, {upsert: true});
  

  
// 设置字段值
  
db.stu.update({'name': 'yuzf'}, {$set: {'grade': 200}});
  

  
// 删除指定字段
  
db.stu.update({'name': 'yuzf'}, {$unset: {'grade': 200}});
  

查询数据


[*]  获取指定名称的集合: db.getCollection("tableName");

[*]  获取集合里所有的数据:db.tableName.find().pretty();

[*]  获取集合里的指定数据:db.users.find({'uid', 'yuzf'}).pretty();

[*]  获取集合里的指定数据,然后指向看指定数据, 在第二个参数里添加键,并设置键的值为1即可:db.users.find({'uid': 'yuzf'}, {'uid': 1}).pretty();

[*]使用函数sort, limit, skip

[*]以uid进行排序: db.users.find().sort({ 'uid': 1 });
[*]限制查询结果返回的最大数目为10: db.users.find().limit(10);
[*]返回查询结果除了前20条的文档的其他文档: db.users.find().skip(20);

[*]使用固定集合、自然顺序和$natural

[*]固定集合必须使用createCollection(), 以显示的方式创建: db.createCollection("users", {capped: true,>
[*]因为固定集合的顺序和插入顺序是一样的, 如果想要逆转排序: db.users.find().sort({ $natural: -1 }).limit(10);

[*]  获取单个文档: db.users.findOne();

[*]使用常用的聚合命令count, distinct, group

[*]统计users表里有多少个文档: db.users.count();
[*]去重: db.users.distinct('uid');, 将会返回一个数组,数组里包含的元素是去重了的uid。
[*]将结果分组:

  

db.calendars.group({  key: {uid: true},
  initial: {total: 0},
  reduce: function(items, prev) {
  prev.total += 1;
  }
  });
  

  
// 以uid进行分组。
  
// 为每个已分组的结果提供一个基数。
  
// 正在遍历的当前文档和聚集计数对象(我认为就是那个基数)。
  

  
// 最后的结果格式数据是:
  
[
  {
  'uid': 'yuzf',
  'total': 1,
  },
  {
  'uid': 'test',
  'total': 3,
  }
  
]
  


[*]使用条件操作符

[*]执行大于和小于($lt,$gt,$lte,$gte)比较: db.users.find({ departmentNumber: {$lt: 100} });
[*]获取除uid为yuzf以外的其他文档: db.calendars.find({'uid': {$ne: 'yuzf'}}).pretty();
[*]指定一个匹配的数组($in): db.calendars.find({'uid': {$in: ['yuzf', 'yangh']}}).pretty();
[*]查找某个不在数组中的值: db.calendars.find({'uid': {$nin: ['yuzf', 'yangh']}}).pretty();
[*]匹配文档中的所有属性($all): db.calendars.find({'uid': {$all: ['yuzf', 'yangh']}}).pretty();
[*]在文档中搜索多个表达式: db.calendars.find({'uid': {$or: ['yuzf, 'yangh'']}}).pretty();
[*]使用slice来获取文档(分页): 不知道为什么,自己跑的时候报错,$slice unknown operator
[*]还有一些其他的,感觉不是很常用。

aggregate
  就我自己的理解,aggregate相当于Linux系统下的管道符,当前得到的结果可以作为下一次计算的输入。
  有很多管道操作符,这里只是介绍一部分常用的操作符。

$group
  关于group操作符, 它类似于关系数据库里的group by, 需要记住以下这几点:


[*]  必须显示以_id作为分组。

[*]  如果要以"什么"为分组,"什么"必须是对象。

[*]  $表示该元素是对文档中字段的引用。

  看一个例子:
  

// 表结构是{device, isSmart,>
  
db.phones.aggregate({$group: {_id: "$device"}, total: {$sum: "$price"}});
  

  
// 得到的结果是:
  
{"id": "iPhone5S", "total": 10000}
  
{"id": "iPhone6S", "total": 10200}
  
{"id": "iPhone6P", "total": 13000}
  

$sum
  如果我们想要找到一个文档,计数就加一。那么我们可以使用$sum。就像上面的日子改写后就成了下面这样:
  

db.phones.aggregate({$group: {_id: "$device"}, count: {$sum: 1}});  

  
// 得到的结果是:
  
{"id": "iPhone5S", "count": 18}
  
{"id": "iPhone6S", "count": 2}
  
{"id": "iPhone6P", "count": 10}
  

$limit
  如果我们想要限制得到的数据只有10条,那么就会用到了$limit, 我认为它和查询时的limit()没有什么区别。
  

db.phones.aggregate({$group: {_id: "$device", count: {$sum: 1}}}, {$limit: 10});  

$match
  我猜想这个管道符应该用得特别多,通过它可在聚集管道中高效地返回一个普通地MongoDB查询的结果。
  $match操作符,最好位于管道的开始, 因为这样会大大减少开销。
  

db.phones.aggregate({$match: {"device": "iPhone9S"}});  

$sort
  它和普通查询里的sort没有什么不同。

$unwind
  这应该也是一个特别常用的管道符, 它接受一个数组并将每个元素分割到一个新的文档中(在内存中而不是添加到集合中)。

$project
  如果我们查询出来我们想要的数据,但是只是想要一部分的字段,该如何呢?那么就会用到$project这个管道符了。
  

// 只会显示_id和device这两个字段  
db.phones.aggregate({$project: {_id: 1, device: 1}});
  

$skip
  同样,它和普通查询里的skip没有什么不同。如果我们想要得到3000条数据里的第1500~1510条数据该怎么写呢?
  

db.phones.aggregate({$skip: 1500, $limit: 10});  

mongoose的使用
  未完待续...
  参考:
  mongoDB基本使用
  
mongodb大数据处理权威指南
页: [1]
查看完整版本: mongodb新人扫盲