Съжалявам, че разбирам, че имате проблем с конектора.
Информация относно разделителите може да бъде намерена на сайта с документация за конектора на Spark . Моля, подайте заявка в проекта jira на Документи ако смятате, че нещо липсва или е неясно, това наистина може да помогне на бъдещи потребители!
Разделителят по подразбиране е тънка обвивка около MongoSamplePartitionerкод>
. Той разделя колекция на дялове с размер въз основа на статистическа извадка от колекцията.
MongoShardedPartitioner
използва shardKey
за генериране на дялове. По подразбиране ще използва _id
като ключ. Може да се наложи да конфигурирате тази стойност.
Забележка: Хешираните shardkeys сане поддържан от MongoShardedPartitioner
тъй като в момента няма начин да се направи заявка за колекция срещу хешираната стойност - така че при извличане на дялове няма да успее да върне резултати. Добавих DOCS-12345
за актуализиране на документацията.
Изглежда, че има проблем във вашата настройка, където MongoShardedPartitioner
не успява да раздели колекцията според очакванията и връща 0 резултата. Изводът на схемата все още ще работи поради начина, по който прави запитвания към колекцията. Ако не е проблем с конфигурацията/хеширания shardkey, тогава проблемът, моля, подайте грешка в проекта Spark jira и аз мога да ви помогна да идентифицирате причината и да пусна решение за вас.