<返回更多

华为架构师整理Redis数据结构的大厂最佳实践

2021-11-01    JavaEdge
加入收藏

1 概述

数据结构和内部编码

华为架构师整理Redis数据结构的大厂最佳实践

 

无传统关系型数据库的 Table 模型

schema 所对应的db仅以编号区分。同一 db 内,key 作为顶层模型,它的值是扁平化的。即 db 就是key的命名空间。
key的定义通常以 : 分隔,如:Article:Count:1
常用的redis数据类型有:string、list、set、map、sorted-set

华为架构师整理Redis数据结构的大厂最佳实践

 

redisObject通用结构

Redis中的所有value 都是以object 的形式存在的,其通用结构如下

华为架构师整理Redis数据结构的大厂最佳实践

 

单线程

华为架构师整理Redis数据结构的大厂最佳实践

 

单线程为何这么快?

2 string

Redis中的 string 可表示很多语义

redis会根据具体的场景完成自动转换,并根据需要选取底层的实现方式。
例如整数可以由32-bit/64-bit、有符号/无符号承载,以适应不同场景对值域的要求。

内存结构

在Redis内部,string的内部以 int、SDS(简单动态字符串 simple dynamic string)作为存储结构

SDS

typedef struct sdshdr {
    // buf中已经占用的字符长度
    unsigned int len;
    // buf中剩余可用的字符长度
    unsigned int free;
    // 数据空间
    char buf[];
}

buf 的扩容与缩容

当对SDS 进行操作时,如果超出了容量。SDS会对其进行扩容,触发条件如下:

字节串与字符串

SDS中存储的内容可以是ASCII 字符串,也可以是字节串。由于SDS通过len 字段来确定业务串的长度,因此业务串可以存储非文本内容。对于字符串的场景,buf[len] 作为业务串结尾的’’ 又可以复用C的已有字符串函数。

SDS编码的优化

value 在内存中有2个部分:redisObject和ptr指向的字节串部分。
在创建时,通常要分别为2个部分申请内存,但是对于小字节串,可以一次性申请。

incr userid:pageview (单线程:无竞争)。缓存视频的基本信息(数据源在MySQL)

华为架构师整理Redis数据结构的大厂最佳实践

 

public VideoInfo get(Long id) {
	String redisKey = redisPrefix + id;
	VideoInfo videoInfo e redis.get(redisKey);
	if (videoInfo == null) {
		videoInfo = mysql.get(id);
		if (videoInfo != null) {
			// 序列化
			redis.set(redisKey serialize(videoInfo)):
		}
	}
}			
华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


除此之外,string 类型的value还有一些CAS的原子操作,如:get、set、set value nx(如果不存在就设置)、set value xx(如果存在就设置)。

String 类型是二进制安全的,也就是说在Redis中String类型可以包含各种数据,比如一张JPEG图片或者是一个序列化的Ruby对象。一个String类型的值最大长度可以是512M。

在Redis中String有很多有趣的用法

List

可从头部(左侧)加入元素,也可以从尾部(右侧)加入元素。有序列表。

像微博粉丝,即可以list存储做缓存。

key = 某大v

value = [zhangsan, lisi, wangwu]

所以可存储一些list型的数据结构,如:

可通过lrange命令,即从某元素开始读取多少元素,可基于list实现分页查询,这就是基于redis实现简单的高性能分页,可以做类似微博那种下拉不断分页的东西,性能高,就一页一页走。

搞个简单的消息队列,从list头推进去,从list尾拉出来。

List类型中存储一系列String值,这些String按照插入顺序排序。

5.1 内存数据结构

List 类型的 value对象,由 linkedlist 或 ziplist 实现。
当 List 元素个数少并且元素内容长度不大采用ziplist 实现,否则使用linkedlist

5.1.1 linkedlist实现

链表的代码结构

typedef struct list {
  // 头结点
  listNode *head;
  // 尾节点
  listNode *tail;
  // 节点值复制函数
  void *(*dup)(void * ptr);
  // 节点值释放函数
  void *(*free)(void *ptr);
  // 节点值对比函数
  int (*match)(void *ptr, void *key);
  // 链表长度
  unsigned long len;  
} list;

// Node节点结构
typedef struct listNode {
	struct listNode *prev;
	struct listNode *next;
	void *value;
} listNode;

linkedlist 结构图

华为架构师整理Redis数据结构的大厂最佳实践

 

5.1.2 ziplist实现

存储在连续内存

华为架构师整理Redis数据结构的大厂最佳实践

 

linkedlist和ziplist的rpush、rpop、llen的时间复杂度都是O(1):

ziplist的Entry结构:

华为架构师整理Redis数据结构的大厂最佳实践

 


记录前一个相邻的Entry的长度,便于双向遍历,类似linkedlist的prev指针。
ziplist是连续存储,指针由偏移量来承载。
Redis中实现了2种方式实现:

当前一个Entry长度变化时,可能导致后续的所有空间移动,虽然这种情况发生可能性较小。

Entry内容本身是自描述的,意味着第二部分(Entry内容)包含了几个信息:Entry内容类型、长度和内容本身。而内容本身包含:类型长度部分和内容本身部分。类型和长度同样采用变长编码:

当在一个空的K执行这些操作时,会创建一个新列表。当一个操作清空了一个list时,该list对应的key会被删除。若使用一个不存在的K,就会使用一个空list。

LPUSH mylist a   # 现在list是 "a"
LPUSH mylist b   # 现在list是"b","a"
RPUSH mylist c   # 现在list是 "b","a","c" (注意这次使用的是 RPUSH)

list的最大长度是2^32 – 1个元素(4294967295,一个list中可以有多达40多亿个元素)。

从时间复杂度的角度来看,Redis list类型的最大特性是:即使是在list的头端或者尾端做百万次的插入和删除操作,也能保持稳定的很少的时间消耗。在list的两端访问元素是非常快的,但是如果要访问一个很大的list中的中间部分的元素就会比较慢了,时间复杂度是O(N)

适用场景

Set

类似List,但无序且其元素不重复。

向集合中添加多次相同的元素,集合中只存在一个该元素。在实际应用中,这意味着在添加一个元素前不需要先检查元素是否存在。

支持多个服务器端命令来从现有集合开始计算集合,所以执行集合的交集,并集,差集都很快。

set的最大长度是2^32 – 1个元素(一个set中可多达40多亿个元素)。

内存数据结构

Set在Redis中以intset 或 hashtable存储:

intset

核心元素是一个字节数组,从小到大有序的存放元素

华为架构师整理Redis数据结构的大厂最佳实践

 


结构图

华为架构师整理Redis数据结构的大厂最佳实践

 


因为元素有序排列,所以SET的获取操作采用二分查找,复杂度为O(log(N))。

进行插入操作时:

时间复杂度为O(N)。为使二分查找的速度足够快,存储在content 中的元素是定长的。

华为架构师整理Redis数据结构的大厂最佳实践

 


当插入2018 时,所有的元素向后移动,并且不会发生覆盖。
当Set 中存放的整型元素集中在小整数范围[-128, 127]内时,可大大的节省内存空间。
IntSet支持升级,但是不支持降级。

适用场景

无序集合,自动去重,数据太多时不太推荐使用。
直接基于set将系统里需要去重的数据扔进去,自动就给去重了,如果你需要对一些数据进行快速的全局去重,你当然也可以基于JVM内存里的HashSet进行去重,但若你的某个系统部署在多台机器呢?就需要基于redis进行全局的set去重。

可基于set玩交集、并集、差集操作,比如交集:

全局这种计算开销也大。

Hash/Map

一般可将结构化的数据,比如一个对象(前提是这个对象未嵌套其他的对象)给缓存在redis里,然后每次读写缓存的时候,即可直接操作hash里的某个字段。

key=150

value={
  “id”: 150,
  “name”: “zhangsan”,
  “age”: 20
}

hash类的数据结构,主要存放一些对象,把一些简单的对象给缓存起来,后续操作的时候,可直接仅修改该对象中的某字段的值。

value={
  “id”: 150,
  “name”: “zhangsan”,
  “age”: 21
}

因为Redis本身是一个K.V存储结构,Hash结构可理解为subkey - subvalue
这里面的subkey - subvalue只能是

因为Map的 value 可表示整型和浮点型,因此Map也可以使用hincrby 对某个field的value值做自增操作。

内存数据结构

hash有HashTable 和 ziplist 两种实现。对于数据量较小的hash,使用ziplist 实现。

HashTable 实现

HashTable在Redis 中分为3 层,自底向上分别是:

dict是Hash表存储的顶层结构

// 哈希表(字典)数据结构,Redis 的所有键值对都会存储在这里。其中包含两个哈希表。
typedef struct dict {
    // 哈希表的类型,包括哈希函数,比较函数,键值的内存释放函数
    dictType *type;
    // 存储一些额外的数据
    void *privdata;
    // 两个哈希表
    dictht ht[2];
    // 哈希表重置下标,指定的是哈希数组的数组下标
    int rehashidx; /* rehashing not in progress if rehashidx == -1 */
    // 绑定到哈希表的迭代器个数
    int iterators; /* number of iterators currently running */
} dict;

Hash表的核心结构是dictht,它的table 字段维护着 Hash 桶,桶(bucket)是一个数组,数组的元素指向桶中的第一个元素(dictEntry)。

typedef struct dictht { 
    //槽位数组
    dictEntry **table; 
    //槽位数组长度
    unsigned long size; 
    //用于计算索引的掩码 
    unsigned long sizemask;
    //真正存储的键值对数量
    unsigned long used; 
} dictht;

结构图

华为架构师整理Redis数据结构的大厂最佳实践

 


Hash表使用【链地址法】解决Hash冲突。当一个 bucket 中的 Entry 很多时,Hash表的插入性能会下降,此时就需要增加bucket的个数来减少Hash冲突。

Hash表扩容

和大多数Hash表实现一样,Redis引入负载因子判定是否需要增加bucket个数:

负载因子 = Hash表中已有元素 / bucket数量

扩容后,bucket 数量是原先2倍。目前有2 个阀值:

ziplist 实现

这里的 ziplist 和List#ziplist的实现类似,都是通过Entry 存放元素。
不同的是,Map#ziplist的Entry个数总是2的整数倍:

ziplist承载时,Map的大多数操作不再是O(1)了,而是由Hash表遍历,变成了链表的遍历,复杂度变为O(N)
由于Map相对较小时采用ziplist,采用Hash表时计算hash值的开销较大,因此综合起来ziplist的性能相对好一些

哈希键值结构

华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


特点:

hget key field O(1)
# 获取 hash key 对应的 field 的 value

hset key field value O(1)
#  设置 hash key 对应的 field 的 value

hdel key field O(1)
# 删除 hash key 对应的 field 的 value

实操

127.0.0.1:6379> hset user:1:info age 23
(integer) 1
127.0.0.1:6379> hget user:1:info age
"23"
127.0.0.1:6379> hset user:1:info name JAVAEdge
(integer) 1
127.0.0.1:6379> hgetall user:1:info
1) "age"
2) "23"
3) "name"
4) "JavaEdge"
127.0.0.1:6379> hdel user:1:info age
(integer) 1
127.0.0.1:6379> hgetall user:1:info
1) "name"
2) "JavaEdge"
hexists key field O(1)
# 判断hash key是否有field
hlen key O(1)
# 获取hash key field的数量
127.0.0.1:6379> hgetall user:1:info
1) "name"
2) "JavaEdge"
127.0.0.1:6379> HEXISTS user:1:info name
(integer) 1
127.0.0.1:6379> HLEN user:1:info
(integer) 1
hmget key field1 field2... fieldN O(N)
# 批量获取 hash key 的一批 field 对应的值
hmset key field1 value1 field2 value2...fieldN valueN O(N)
# 批量设置 hash key的一批field value

华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


华为架构师整理Redis数据结构的大厂最佳实践

 


Redis Hashes 保存String域和String值之间的映射,所以它们是用来表示对象的绝佳数据类型(比如一个有着用户名,密码等属性的User对象)

| `1` | `@cli` |

| `2` | `HMSET user:1000 username antirez password P1pp0 age 34` |

| `3` | `HGETALL user:1000` |

| `4` | `HSET user:1000 password 12345` |

| `5` | `HGETALL user:1000` |

一个有着少量数据域(这里的少量大概100上下)的hash,其存储方式占用很小的空间,所以在一个小的Redis实例中就可以存储上百万的这种对象

Hash的最大长度是2^32 – 1个域值对(4294967295,一个Hash中可以有多达40多亿个域值对)

Sorted sets(zset)

有序集合,去重但可排序,写进去时候给个分数,可以自定义排序规则。比如想根据时间排序,则写时可以使用时间戳作为分数。

排行榜:将每个用户以及其对应的什么分数写进去。

127.0.0.1:6379> zadd board 1.0 JavaEdge
(integer) 1

获取排名前100的用户:

127.0.0.1:6379> zrevrange board 0 99
1) "JavaEdge"

用户在排行榜里的排名:

127.0.0.1:6379> zrank board JavaEdge
(integer) 0
127.0.0.1:6379> zadd board 85 zhangsan
(integer) 1
127.0.0.1:6379> zadd board 72 wangwu
(integer) 1
127.0.0.1:6379> zadd board 96 lisi
(integer) 1
127.0.0.1:6379> zadd board 62 zhaoliu
(integer) 1

# 获取排名前3的用户
127.0.0.1:6379> zrevrange board 0 3
1) "lisi"
2) "zhangsan"
3) "wangwu"
4) "zhaoliu"

127.0.0.1:6379> zrank board zhaoliu
(integer) 1

类似于Map的key-value对,但有序

基本操作

由于Sorted-Set 本身包含排序信息,在普通Set 的基础上,Sorted-Set 新增了一系列和排序相关的操作:

内部数据结构

Sorted-Set类型的valueObject 内部结构有两种:

  1. ziplist
    实现方式和Map类似,由于Sorted-Set包含了Score的排序信息,ziplist内部的key-value元素对的排序方式也是按照Score递增排序的,意味着每次插入数据都要移动之后的数据,因此ziplist适于元素个数不多,元素内容不大的场景。
  2. skiplist+hashtable
    更通用的场景,Sorted-Set使用sliplist来实现。

8.2.1 zskiplist

和通用的跳表不同的是,Redis为每个level 对象增加了span 字段,表示该level 指向的forward节点和当前节点的距离,使得getByRank类的操作效率提升

每次向skiplist 中新增或者删除一个节点时,需要同时修改图标中红色的箭头,修改其forward和span的值。

需要修改的箭头和对skip进行查找操作遍历并废弃过的路径是吻合的。span修改仅是+1或-1。
zskiplist 的查找平均时间复杂度 O(Log(N)),因此add / remove的复杂度也是O(Log(N))。因此Redis中新增的span 提升了获取rank(排序)操作的性能,仅需对遍历路径相加即可(矢量相加)。

还有一点需要注意的是,每个skiplist的节点level 大小都是随机生成的(1-32之间)。

8.2.2 hashtable

zskiplist 是zset 实现顺序相关操作比较高效的数据结构,但是对于简单的zscore操作效率并不高。Redis在实现时,同时使用了Hashtable和skiplist,代码结构如下:

华为架构师整理Redis数据结构的大厂最佳实践

 


Hash表的存在使得Sorted-Set中的Map相关操作复杂度由O(N)变为O(1)。

Redis有序集合类型与Redis的集合类型类似,是非重复的String元素的集合。不同之处在于,有序集合中的每个成员都关联一个Score,Score是在排序时候使用的,按照Score的值从小到大进行排序。集合中每个元素是唯一的,但Score有可能重复。

使用有序集合可以很高效的进行,添加,移除,更新元素的操作(时间消耗与元素个数的对数成比例)。由于元素在集合中的位置是有序的,使用get ranges by score或者by rank(位置)来顺序获取或者随机读取效率都很高。(本句不确定,未完全理解原文意思,是根据自己对Redis的浅显理解进行的翻译)访问有序集合中间部分的元素也非常快,所以可以把有序集合当做一个不允许重复元素的智能列表,你可以快速访问需要的一切:获取有序元素,快速存在测试,快速访问中间的元素等等。

简短来说,使用有序集合可以实现很多高性能的工作,这一点在其他数据库是很难实现的。

应用

而跳表主要服务范围操作,提供O(logN)的复杂度。

Bitmaps

位图类型,String类型上的一组面向bit操作的集合。由于 strings是二进制安全的blob,并且它们的最大长度是512m,所以bitmaps能最大设置 2^32个不同的bit。

HyperLogLogs

pfadd/pfcount/pfmerge。
在redis的实现中,使用标准错误小于1%的估计度量结束。这个算法的神奇在于不再需要与需要统计的项相对应的内存,取而代之,使用的内存一直恒定不变。最坏的情况下只需要12k,就可以计算接近2^64个不同元素的基数。

GEO


geoadd/geohash/geopos/geodist/georadius/georadiusbymember
Redis的GEO特性在 Redis3.2版本中推出,这个功能可以将用户给定的地理位置(经、纬度)信息储存起来,并对这些信息进行操作。

声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多资讯 >>>