MongoDB 3.4rc с 2 милиона записа
Мисля, че проблемът с вашия код е свързан с параметъра 'query', защото правите друга заявка за колекция без индекс.
АКТУАЛИЗАЦИЯ (с резултати/статистика):
db.runCommand( { dropDatabase: 1 } )
db.createCollection("places");
db.places.createIndex( { "locs.loc.coordinates" : "2dsphere" } )
function randInt(n) { return parseInt(Math.random()*n); }
function randFloat(n) { return Math.random()*n; }
for(var j=0; j<10; j++) {
print("Building op "+j);
var bulkop=db.places.initializeOrderedBulkOp() ;
for (var i = 0; i < 1000000; ++i) {
bulkop.insert(
{
locs: [
{
loc : {
type: "Point",
coordinates: [ randFloat(180), randFloat(90) ]
}
},
{
loc : {
coordinates: [ randFloat(180), randFloat(90) ]
}
}
]
}
)
};
print("Executing op "+j);
bulkop.execute();
}
Това е заявката:
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true
}
)
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: { category: "private" }
}
)
След създаване на индекс на "категория":{ locs.loc.coordinates:"2dsphere", категория:1 }
АКТУАЛИЗАЦИЯ: като добавите "maxDistance", можете да изпълните 396ms срещу 6863ms
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: {category: "private"},
maxDistance: 1000000
}
)
maxDistance:1000000
"stats" : {
"nscanned" : NumberInt(107820),
"objectsLoaded" : NumberInt(1),
"avgDistance" : 938598.1782650856,
"maxDistance" : 938598.1782650856,
"time" : NumberInt(396)
}
без "maxDistance":
db.runCommand(
{
geoNear: "places",
near: { type: "Point", coordinates: [ 73.9667, 40.78 ] },
spherical: true,
query: {category: "private"}
}
)
"stats" : {
"nscanned" : NumberInt(2023916),
"objectsLoaded" : NumberInt(6),
"avgDistance" : 3013587.205365039,
"maxDistance" : 4263919.742779636,
"time" : NumberInt(6863)
}
Източник:https://www.mongodb .com/blog/post/geospatial-performance-improvements-in-mongodb-3-2
Още повече, че заявката ви използва "масив от координати", който според мен е безполезен, тъй като един обект (обикновено) има 1 точка за геолокация.
Друг начин за оптимизиране е да направите „geoWithin " тъй като не сортира по "разстояние" (може би искате да сортирате по "най-гласуван ресторант"). В зависимост от сценария.