Производителността на MongoDB при заявки за агрегиране

Идеята е, че подобрявате производителността на заявките за агрегиране, като използвате MapReduce върху разчленена база данни, която се разпределя върху множество машини.

Направих някои сравнения на производителността на Mapreduce на Mongo с оператор за група по избор в Oracle на същата машина. Открих, че Mongo е приблизително 25 пъти по-бавен. Това означава, че трябва да разделя данните на поне 25 машини, за да получа същата производителност с Mongo, както Oracle доставя на една машина. Използвах колекция/таблица с приблизително 14 милиона документа/редове.

Експортирането на данните от mongo чрез mongoexport.exe и използването на експортираните данни като външна таблица в Oracle и извършването на групиране в Oracle беше много по-бързо от използването на собствения MapReduce на Mongo.