HyperLogLog
wordt gebruikt voor het tellen van unieke items. Het kan een groot aantal items tellen met een beetje geheugen. De geretourneerde kardinaliteit is echter NIET exact, maar wordt benaderd met een standard error
.
0,81% is de standard error
, NIET de valse positieven. Voor uw voorbeeld kunt u PFCOUNT HLL
. bellen om het geschatte aantal unieke items te krijgen dat u in de HyperLogLog
plaatst . Het geretourneerde nummer moet binnen het bereik liggen van [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
geeft 1 terug als de geschatte kardinaliteit wordt gewijzigd na het uitvoeren van de opdracht. Het geeft 0 terug, anders. Het heeft niets te maken met false positive
.
Het lijkt erop dat je een Bloom-filter nodig hebt, dat je kan vertellen of een item al in een dataset bestaat, met vals positief. U kunt een Bloom Filter
implementeren met Redis natuurlijk. En daar zou een open source-project voor moeten zijn.