什么是布隆过滤器？如何实现布隆过滤器？

2024-01-05 微信公众号 Java中文社群

以下我们介绍了什么是布隆过滤器？它的使用场景和执行流程，以及在 redis 中它的使用，那么问题来了，在日常开发中，也就是在 JAVA 开发中，我们又将如何操作布隆过滤器呢？

布隆过滤器（Bloom Filter）是一种空间效率极高的概率型数据结构，用于判断一个元素是否在一个集合中。它基于位数组和多个哈希函数的原理，可以高效地进行元素的查询，而且占用的空间相对较小，如下图所示：

什么是布隆过滤器？如何实现布隆过滤器？

根据 key 值计算出它的存储位置，然后将此位置标识全部标识为 1（未存放数据的位置全部为 0），查询时也是查询对应的位置是否全部为 1，如果全部为 1，则说明数据是可能存在的，否则一定不存在。

也就是说，如果布隆过滤器说一个元素不在集合中，那么它一定不在这个集合中；但如果它说一个元素在集合中，则有可能是不存在的（存在误差）。

1、布隆执行过程

布隆过滤器的具体执行步骤如下：

布隆过滤器的主要使用场景有以下几个：

在 Redis 中不能直接使用布隆过滤器，但我们可以通过 Redis 4.0 版本之后提供的 modules (扩展模块) 的方式引入，它的实现步骤如下。

“

git clone https://Github.com/RedisLabsModules/redisbloom.git

cd redisbloom

make # 编译redisbloom

”

编译正常执行完，会在根目录生成一个 redisbloom.so 文件。

重新启动 Redis 服务，并指定启动 RedisBloom 插件，具体命令如下：

“

redis-server redis.conf --loadmodule ./src/modules/RedisBloom-master/redisbloom.so

”

创建一个布隆过滤器，并设置期望插入的元素数量和误差率，在 Redis 客户端中输入以下命令：

“

BF.RESERVE my_bloom_filter 0.01 100000

”

在 Redis 客户端中输入以下命令：

“

BF.ADD my_bloom_filter leige

”

在 Redis 客户端中输入以下命令：

“

BF.EXISTS my_bloom_filter leige

”

以上我们介绍了什么是布隆过滤器？它的使用场景和执行流程，以及在 Redis 中它的使用，那么问题来了，在日常开发中，也就是在 Java 开发中，我们又将如何操作布隆过滤器呢？