Краткият отговор е:не можете, не само въз основа на ср. размер на документа (поне не по точен начин).
За да обясня по-подробно:
Необходимото пространство на диска не е просто функция на средния размер на документа. Има и необходимото място за всички индекси, които създавате. След това има необходимото пространство, ако задействате тези ходове (въпреки подпълването, това се случва) - това пространство се поставя в списък, за да се използва повторно, но в зависимост от данните, които впоследствие въвеждате, може или не може да е възможно използвайте повторно това пространство.
Можете също така да добавите към факта, че предварителното разпределение ще означава, че понякога шепа документи ще увеличат използването на вашето дисково пространство с ~2 GB, когато се разпредели нов файл с данни. Разбира се, при достатъчно данни, това ще бъде по същество грешка при закръгляване, но си струва да се има предвид.
Единственият начин да оцените съотношението на този тип данни към размер, като приемем постоянен модел на използване, е да го промените във времето за вашия конкретен случай на употреба и да проследите използването на дисковото пространство спрямо вмъкнатите данни (броят документи може да е по-добър от обема на данните в зависимост от променливостта на размера на документа).
По същия начин, ако проследите скоростта на вмъкване, размера на документа и мястото, спечелено обратно от повторно синхронизиране/поправка. FYI – можете да синхронизирате вторичен елемент от нулата, за да получите „свежо“ копие на файловете с данни, вместо да извършвате поправка, което може да бъде по-малко разрушително и да използва по-малко място в зависимост от вашата настройка.