Con un número fijo de funciones, ¿cómo puedo calcular el tamaño de un filtro Bloom dada la probabilidad de falsos positivos?

Necesito implementar un filtro de floración. Y no puedo encontrar una salida a esto.

Con un número fijo de funciones, ¿cómo puedo calcular el tamaño de un filtro Bloom dada la probabilidad de falsos positivos?

Por ejemplo, quiero que el filtro tenga un 10% de falsos positivos, que tenga las funciones numéricas y el número de elementos en el conjunto.

¿Cómo puedo calcular el tamaño del filtro Bloom que coincida con la probabilidad de falsos positivos?

La fórmula para esto está en la Wikipedia . Suponiendo que tiene suficientes funciones hash disponibles, necesita ~ 4.8 bits por elemento dada la tasa de falsos positivos que especificó de 0.1.

En este caso, parece que 4 funciones hash serían óptimas. Tenga en cuenta que más funciones hash no siempre son mejores: si hay muchas funciones hash relacionadas con el tamaño del filtro, se activan rápidamente casi todos los bits y se obtienen muchos falsos positivos.