MongoDB slaat gegevens op in een totaal ander formaat, BSON genaamd, dat meer schijfruimte in beslag gaat nemen. Niet alleen moeten de waarden voor elk veld worden opgeslagen, het zal ook de kolomnamen in elk document (rij) opnieuw moeten opslaan. Als u grote kolomnamen heeft, kan dit de grootte in MongoDB zeker vergroten tot 8 tot 10 keer uw CSV-bestand. Indien mogelijk kunt u kijken naar het inkorten van uw veldnamen als dit te veel voor u is.
MongoDB verdeelt ook vooraf gegevensbestanden voor u. Bijvoorbeeld op het moment dat het begint met het toevoegen van gegevens aan taq.2
, maakt het taq.3
, en op dezelfde manier wanneer het begint te schrijven in taq.4
het creëert tag.5
. Dus in uw geval, stel dat uw 230 MB-bestand 1,9 GB aan gegevens zou creëren, MongoDB heeft de 2,0G-formaat taq.5
al toegewezen . Dit gedrag kan worden uitgeschakeld door --noprealloc
. op te geven op de opdrachtregel bij het starten van mongod
.