布隆过滤器(Bloom Filter)是一种空间效率极高的概率型数据结构,用于判断一个元素是否在一个集合中。它基于位数组和多个哈希函数的原理,可以高效地进行元素的查询,而且占用的空间相对较小,如下图所示:
根据 key 值计算出它的存储位置,然后将此位置标识全部标识为 1(未存放数据的位置全部为 0),查询时也是查询对应的位置是否全部为 1,如果全部为 1,则说明数据是可能存在的,否则一定不存在。
也就是说,如果布隆过滤器说一个元素不在集合中,那么它一定不在这个集合中;但如果它说一个元素在集合中,则有可能是不存在的(存在误差)。
布隆过滤器的具体执行步骤如下:
布隆过滤器的主要使用场景有以下几个:
在 Redis 中不能直接使用布隆过滤器,但我们可以通过 Redis 4.0 版本之后提供的 modules (扩展模块) 的方式引入,它的实现步骤如下。
“
git clone https://Github.com/RedisLabsModules/redisbloom.git
cd redisbloom
make # 编译redisbloom
”
编译正常执行完,会在根目录生成一个 redisbloom.so 文件。
重新启动 Redis 服务,并指定启动 RedisBloom 插件,具体命令如下:
“
redis-server redis.conf --loadmodule ./src/modules/RedisBloom-master/redisbloom.so
”
创建一个布隆过滤器,并设置期望插入的元素数量和误差率,在 Redis 客户端中输入以下命令:
“
BF.RESERVE my_bloom_filter 0.01 100000
”
在 Redis 客户端中输入以下命令:
“
BF.ADD my_bloom_filter leige
”
在 Redis 客户端中输入以下命令:
“
BF.EXISTS my_bloom_filter leige
”
以上我们介绍了什么是布隆过滤器?它的使用场景和执行流程,以及在 Redis 中它的使用,那么问题来了,在日常开发中,也就是在 Java 开发中,我们又将如何操作布隆过滤器呢?