Mongo的聚合操作:aggregate、lookup、let、limit、skip

先看案例。

订单orders集合的情况

db.orders.insertMany( [
  { "_id" : 1, "item" : "almonds", "price" : 12, "ordered" : 2 },
  { "_id" : 2, "item" : "cookies", "price" : 10, "ordered" : 60 }
] )

仓库warehouses集合的情况

db.warehouses.insertMany( [
  { "_id" : 1, "stock_item" : "almonds", warehouse: "A", "instock" : 120 },
  { "_id" : 3, "stock_item" : "almonds", warehouse: "B", "instock" : 60 },
  { "_id" : 5, "stock_item" : "cookies", warehouse: "A", "instock" : 80 }
] )

上面这个是官方案例的情况,从订单表入手聚合仓库表信息,形成每个item的订单数量、仓库位置信息对象。

具体看官方链接就可以了。$lookup (aggregation) — MongoDB Manual

下面是一些解释说明

db.orders.aggregate( [ //从orders表入手
   {
      $lookup:
         {
           from: "warehouses",//聚合查询warehouse表
           let: { order_item: "$item"}, //用$$order_item指代order表的.item字段。$$可以理解成lookup中的变量前缀,$表示当前层级
           pipeline: [
              { $match: //在warehouse中匹配
                 { $expr: //表达式
                         { $eq: [ "$stock_item",  "$$order_item" ] }, //eq即等于,注意这里的变量名,$stock_item是warehouse表的,$$order_item是来自order表lookup的变量。
                 }
              },
              { $project: { stock_item: 0, _id: 0 } }, //各种对warehouse表查询的限定都放在这里
              { $limit:10},
              { $skip:0},
           ],
           as: "stockdata" //输出字段名,就是会把warehouse中查到的信息放到结果对象的.stockdata中。
         }
    }
] )

简单情况

如果我们不要对嵌套查询的表格做限定,只是单纯的吧信息集中过来,那么可以简单得多。

比如article表文档格式如{_id:..,title:...,authorId'...},而user表的文档格式如{_id:...,name:xxx,password:'xxxx'},那么我们可以用下面的pipline管道完成聚合(Golang实现)。

articleidObj, _ := primitive.ObjectIDFromHex("xxx")
useridObj, _ := primitive.ObjectIDFromHex("xxx")
pipline := []bson.M{
              {
            "$match":bson.M{ //找到文章
                "_id":         articleidObj,
            },
         },
              {
            "$lookup": bson.M{
                "from":         "user",
                "localField":   "authorId", //article文档中的字段
                "foreignField": "_id", //user文档中的字段
                "as":           "author", //user表查出结果放到这个字段
            },
        },
                {
            "$project": bson.M{
                "title":     1,  //注意这里!authorid字段将不出现在结果里
                "author":bson.M{  //注意这里!不是用authorid,而是用as的author
                  "name":     1,  //注意这里!结果里不会出现password字段
                     },
            },
        },
        {
            "$sort": bson.M{"Ts": -1}, //文章排序
        },
        {
            "$skip": Skip,
        },
        {
            "$limit": Limit,
        },

    }
opts := options.Aggregate().SetMaxTime(1 * time.Second)
cur, err := dbc.Aggregate(ctx, pipline, opts)

var vli []bson.M
if err != nil {
    return uds.RespErr(err.Error()), nil
}
for cur.Next(context.TODO()) {
    var v bson.M
    err := cur.Decode(&v)
    if err != nil {
        return uds.RespErr(err.Error()), nil
    }
    vli = append(vli, v)
}

注意这里的$project,$limit...都是针对外层数据集article的,不是针对内层限定的,就是最终最多返回limit个article,而article.author里面有多少个并不影响(当然这里_id是唯一的,所以只会返回一个)

什么时候使用let

假如我们处理的不是文章的作者,而是文章的读者数据,怎么办?

article.readers肯定是个列表,可以是[userid1,userid2,userid3]这种,也可以是[{uid:xxx,time:xxx},[{uid:yyy,time:yyy}]这种。

对于article.readers=[userid1,userid2,userid3]这种情况,要把读者user姓名写进article查询结果,格式大致如下:

pipline := []bson.M{
        {
            "$match": bson.M{
                "_id": articleidObj,
            },
        },
        {
            "$lookup": bson.M{
                "from": "user",
                "as":   "readers",
                "let":  bson.M{"readersids": "$readers"}, //注意这里!
                "pipeline": []bson.M{
                    {
                        "$expr": bson.M{
                                "$in": bson.A{"$_id", "$$readersids"}, //注意这里的$in
                        },
                    },
                    {
                        "$skip": 0,
                    },
                    {
                        "$limit": 2,
                    },
                    {
                        "$project": bson.M{
                            "name": 1, //注意这里!
                        },,
                    },
                },
            },
        },
    }

列表是对象的情况

对于article.readers=[{uid:xxx,time:xxx},[{uid:yyy,time:yyy}]这种情况,要把读者user姓名写进article查询结果,格式大致如下:

pipline := []bson.M{
        {
            "$match": bson.M{
                "_id": articleidObj,
            },
        },
        {
            "$lookup": bson.M{
                "from": "user",
                "as":   "readers",
                "let":  bson.M{"readersid": "$readers.uid"}, //注意这里!
                "pipeline": []bson.M{
                    {
                        "$expr": bson.M{
                                "$eq": bson.A{"$_id", "$$readersid"}, //注意这里的$eq
                        },
                    },
                    {
                        "$skip": 0,
                    },
                    {
                        "$limit": 2,
                    },
                    {
                        "$project": bson.M{
                            "name": 1, 
                        },
                    },
                },
            },
        },
    }

简要汇总

对于查A表时候同时用A.arr数组字段嵌套查B表,结果放入A.as字段,其中lookup内pipeline变量的规则是arr表示数组元素,arr.key表示数组对象的子字段。在lookup中注意$是B表字段,$$是lookup中定义的A表字段。

lookup中的localfield不与pipeline字段一起用,pipeline只能和let一起用。

最后查询结果是来自A表的,知识其中的A.as字段来自B表,所以最外层的$project中是可以对A.as内的字段进行设定的,很多时候这样可以省事很多。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 151,511评论 1 330
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 64,495评论 1 273
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 101,595评论 0 225
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 42,558评论 0 190
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 50,715评论 3 270
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 39,672评论 1 192
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,112评论 2 291
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 29,837评论 0 181
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 33,417评论 0 228
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 29,928评论 2 232
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,316评论 1 242
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 27,773评论 2 234
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,253评论 3 220
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 25,827评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,440评论 0 180
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 34,523评论 2 249
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 34,583评论 2 249

推荐阅读更多精彩内容