Ако искате да получите списък с идентични (с изключение на _id
поле, очевидно) документи във вашата колекция, ето как можете да направите това:
collection.aggregate({
$project: {
"_id": 1, // keep the _id field where it is anyway
"doc": "$$ROOT" // store the entire document in the "doc" field
}
}, {
$project: {
"doc._id": 0 // remove the _id from the stored document because we do not want to compare it
}
}, {
$group: {
"_id": "$doc", // group by the entire document's contents as in "compare the whole document"
"ids": { $push: "$_id" }, // create an array of all IDs that form this group
"count": { $sum: 1 } // count the number of documents in this group
}
}, {
$match: {
"count": { $gt: 1 } // only show what's duplicated
}
})
Както винаги с рамката за агрегиране, можете да опитате да разберете какво точно се случва във всяка стъпка, като коментирате всички стъпки и след това активирате всичко отново етап по етап.