HyperLogLog
се използва за броене на уникални артикули. Може да преброи голям брой елементи с малко памет. Въпреки това, върнатата мощност НЕ е точна, а се приближава с standard error
.
0,81% е standard error
, НЕ фалшиво положително. Например, можете да извикате PFCOUNT HLL
за да получите приблизителния брой уникални елементи, които сте поставили в HyperLogLog
. Върнатото число трябва да е в диапазона от [10000 * (1 - 0.81%), 10000 * (1 + 0.81%)]
.
PFADD
връща 1, ако изчислената мощност се промени след изпълнение на командата. В противен случай връща 0. Няма нищо общо с false positive
.
Изглежда това, от което се нуждаете, е Bloom Filter, който може да ви каже дали даден елемент вече съществува в набор от данни, с фалшиво положително. Можете да приложите Bloom Filter
с Redis, разбира се. И трябва да има някакъв проект с отворен код за това.