MongoDb-database versus verzameling

U kijkt dus ergens in de buurt van 100 miljard records (1 miljoen records * 100.000 gebruikers).

De beste manier om met grote hoeveelheden gegevens om te gaan, is door een shard-cluster te maken die de gegevens verdeelt over verschillende servers die via de mongo-client als één logische eenheid worden gepresenteerd.

Daarom is het antwoord op uw vraag:zet al uw records in een enkele shard-verzameling.

Het aantal benodigde shards en de configuratie van het cluster is gerelateerd aan de grootte van de gegevens en andere factoren, zoals de hoeveelheid en distributie van lees- en schrijfbewerkingen. De antwoorden op die vragen zijn waarschijnlijk heel specifiek voor uw unieke situatie, dus ik zal niet proberen ze te raden.

Ik zou waarschijnlijk beginnen met te beslissen hoeveel shards je de tijd en machines hebt om het systeem op een cluster van zoveel machines in te stellen en te testen. Op basis van de prestaties daarvan kunt u beslissen of u meer of minder shards in uw cluster nodig heeft