MongoDB
 sql >> база данни >  >> NoSQL >> MongoDB

Извършете пресичане на агрегиране/задаване на MongoDB

Това е донякъде сложно решение. Идеята е първо да използвате DB, за да получите популацията от възможни двойки, след това да се обърнете и да помолите DB да намери двойките в _user поле. Внимавайте, че 1000 потребители ще създадат доста голям списък за сдвояване. Използваме $addFields само в случай, че има повече във входните записи, отколкото виждаме в примера, но ако не, за ефективност заменете с $project за да се намали количеството материал, протичащ през тръбата.

//
// Stage 1:  Get unique set of username pairs.
//
c=db.foo.aggregate([
{$unwind: "$_user"}

// Create single deduped list of users:
,{$group: {_id:null, u: {$addToSet: "$_user"} }}

// Nice little double map here creates the pairs, effectively doing this:
//    for index in range(0, len(list)):
//      first = list[index]
//      for p2 in range(index+1, len(list)):
//        pairs.append([first,list[p2]])
// 
,{$addFields: {u: 
  {$map: {
    input: {$range:[0,{$size:"$u"}]},
    as: "z",
    in: {
        $map: {
            input: {$range:[{$add:[1,"$$z"]},{$size:"$u"}]},
            as: "z2",
            in: [
            {$arrayElemAt:["$u","$$z"]},
            {$arrayElemAt:["$u","$$z2"]}
            ]
        }
    }
    }}
}}

// Turn the array of array of pairs in to a nice single array of pairs:
,{$addFields: {u: {$reduce:{
        input: "$u",
        initialValue:[],
        in:{$concatArrays: [ "$$value", "$$this"]}
        }}
    }}
          ]);


// Stage 2:  Find pairs and tally up the fileids

doc = c.next(); // Get single output from Stage 1 above.                       

u = doc['u'];

c2=db.foo.aggregate([
{$addFields: {_x: {$map: {
                input: u,
                as: "z",
                in: {
                    n: "$$z",
                    q: {$setIsSubset: [ "$$z", "$_user" ]}
                }
            }
        }
    }}
,{$unwind: "$_x"}
,{$match: {"_x.q": true}}
//  Nice use of grouping by an ARRAY here:
,{$group: {_id: "$_x.n", v: {$push: "$_id.fileid"}, n: {$sum:1} }}
,{$match: {"n": {"$gt":1}}}
                     ]);

show(c2);



  1. Redis
  2.   
  3. MongoDB
  4.   
  5. Memcached
  6.   
  7. HBase
  8.   
  9. CouchDB
  1. Неуспешно свързване с отдалечен сървър на mongodb

  2. MongoDb Distinct с C# драйвер за заявка

  3. Webpack - Как ви е необходима незадължителна зависимост в пакет (saslprep)

  4. MongoDB:намерете и findOne с филтриране на вложени масиви

  5. Програмно актуализиране на полета в Mongo и Meteor