В Linux можете да използвате iconv
команда, както е предложено в: Как да премахнете знаци извън UTF-8 от текстов файл
iconv -f utf8 -t utf8 -c file.txt
Не съм запознат с MongoDB, така че нямам представа как да запазя невалидните знаци по време на импортиране.