从根儿上理解 Redis（一）

简单动态字符串

Redis 底层使用 C 语言实现的，但是 Redis 没有直接使用 C 语言传统的字符串表示，而是构建了一种名为简单动态字符串（simple dynamic string，SDS）的抽象类型。
当 Redis 需要的不仅仅是一个字符串字面量，而是一个可以被修改的字符串值时，Redis 就会使用 SDS 来表示字符串值。
下面来看一下，为什么 Redis 会使用 SDS 而不是 C 字符串。

SDS 的定义

struct sdshdr{
    //记录 buf 数组中已使用字节的数量
    //等于 SDS 所保存字符串的长度
    int len;
    //记录 buf 数组中未使用字节的数量
    int free;
    //字节数组，用于保存字符串
    char buf[];
}

image.png

上图是 SDS 结构实例，free 表示生于多少空间，len 表示占用了多少空间，末尾 ‘\0’ 不统计。buf 用于存储。

SDS 对比 C 字符串优势：
1.常数复杂度获取字符串长度，C 字符串获取长度需要遍历整个字符串。
2.杜绝缓冲区溢出，SDS 完全杜绝了缓冲区溢出，在新分配和拼接的时候，都会判断空间够不够。
3.减少修改字符串时带来的内存重分配次数。应用空间预分配和惰性kongjianshifang机制。
4.二进制安全，可以保存任意格式的二进制数据。
5.兼容部分 C 字符串函数。

链表

Redis 构建了自己的链表实现，当一个列表键包含了数量比较多的元素，又或者列表中包含的与那素都是比较长的字符串时，Redis 就会使用链表作为列表键的底层实现。
除了链表键之外，发布与订阅、慢查询、监视器等功能也用到了链表。
链表节点结构：

typedef struct listNode{
    struct listNode *prev;
    struct listNode *next;
    void *value;
}

多个 listNode 组成的双端链表

image.png

Redis 应用一个 list 结构来持有链表，如下：
typedef struct list{
//表头
listNode *head;
//表尾
listNode * tail;
//节点个数
unsigned long len;
//节点值复制函数
void (dup)(void ptr);
//节点释放函数
void (free)(void ptr);
//节点值对比函数
int (match)(void *ptr,void *key);
} list;
list 结构为链表提供了表头指针 head、表尾指针 tail、以及链表长度技术器 len，dup 函数用于复制节点所保存的值，free 函数用于释放链表节点所保存的值，match 函数用于对比链表节点所保存的值和另一个输入值是否相等。
list 示意图：

image.png

字典

字典，又称为符号表、关联数组或映射，是一种用于保存键值对的抽象数据结构。
Redis 的字典使用哈希表作为底层实现，一个哈希表里面可以有多个哈希表结点，每个哈希表结点就保存了字典中的一个键值对。
哈希表结构：

typedef struct dictht{
    //哈希表数组
    dictEntry **table;
    //哈希表大小
    unsigned long size;
    //哈希表大小掩码，用于计算索引值总是等于 size-1
    unsigned long sizemask;
    //该哈希表已有节点的数量
    unsigned long used;
} dictht;

image.png

table 属性是一个数组，数组中每个元素都是一个指向 dictEntry 结构的指针，每个 dictEntry 结构保存着一个键值对。size 记录哈希表的大小，used 标识哈希表已有节点的数量。sizemark 总是等于 size - 1。

哈希表节点：

typedef struct dictEntry{
    //键
    void *key;
    //值
    union{
        void *val;
        unit64_tu64;
        int64_ts64;
    }v;
    //指向下个哈希表节点，形成链表
    struct dictEntry *next;
}dictEntry;

next 属性指向另一个哈希表节点指针，这个指针可以将多个哈希值相同的键值对连接在一起，来解决哈希冲突。

image.png

字典结构：

typedef struct dict{
    //类型特定函数
    dictType *type;
    //私有数据
    void *privdata;
    //哈希表
    dict ht[2];
    //rehash 索引
    //当 rehash 不在进行时，值为 -1
    int rehashidx;
}dict;

type 属性是一个指向 dictType 结构的指针，每个 dictType 结构保存了一簇用于特定类型键值对的函数。
privdata 属性保存了需要传给那些类型特定函数的可选参数。

image.png

跳跃表

跳跃表是一种有序数据结构，它通过在每个节点中维持多个指向其他节点的指针，从而达到快速访问节点的目的。
大部分情况下，跳跃表可以和平衡树相匹配。
Redis 只在两个地方用到了跳跃表，一个是实现有序集合键，另一个是在集群节点中用作内部数据结构。
跳表示例：

image.png

header：指向跳跃表的表头节点。
tail：指向跳跃表的表尾节点。
level：记录目前跳跃表内，层数最大的那个节点的层数。
length：记录跳跃表的长度，也即是，跳跃表目前包含节点的数量。
跳表节点每一层都有前进指针和跨度，跨度标识前进指针指向的节点和当前节点的距离。
每个节点都有一个后退指针，指向前一个节点。
1.0 2.0 3.0 是每个节点的分值，按顺序排列。
o1,o2,o3 是节点所保存的成员对象。

跳跃表节点

typedef struct zskiplistNode{
    //层
    struct zskiplistLevel{
        //前进指针
        struct zskiplistNode *forward;
        //跨度
        unsigned int span；
    }level[];
    //后退指针
    struct zskiplistNode *backward;
    //分值
    double score;
    //成员对象
    robj *obj;
}zskiplistNode;

跳跃表

typedef struct zskiplist{
    //表头节点和表尾节点
    struct skiplistNode *header, *tail;
    表中节点的数量
    unsigned long length；
    //表中层树最大的节点的层数
    int level;
}zskiplist;

整数集合

整数集合是 Redis 用于保存整数值的集合抽象数据结构，可以保存的类型为 int16_t、int32_t 或者 int64_t 的整数，并且保证集合不会出现重复元素。

typedef struct intset{
    //编码方式
    uint32_t encoding;
    //集合包含的元素数量
    uint32_t length;
    //保存元素的数组
    int8_t contents[];
}intset;

contents 是整数集合的底层实现，整数集合的每个元素都是 contents 数字的一个数组项。
length 属性记录了整数集合包含的元素数量。
encoding 决定 contents 数组的类型。

image.png

整数集合的升级

每当我们要将一个新元素添加到整数集合里面，并且新元素的类型比整数集合现有元素的类型长，整数集合就要做升级。
升级分为三步:
1.根据新元素类型，扩展整数集合底层数组的空间大小，并为新元素分配空间。
例如下图，原本集合中的元素是 int16_t 类型的 1,2,3。然后将 65535 添加进去，因为 65535 是 int32_t 类型，所以就要做升级。

image.png

2.将底层数组现有元素转换成新元素相同类型，所有元素如下图，从后往前，一次重新放到新分配的空间的 3,2,1 的位置。

image.png

整数集合升级好处就是灵活性和尽可能的节约内存。
整数集合不支持降级操作。

压缩列表

压缩列表是列表键和哈希键的底层实现之一，当一个列表键只包含少量列表项，并且每个列表要么就是小整数值，要么就是长度比较短的字符串，那么 Redis 就会使用压缩列表来做列表键的底层实现。
压缩列表的构成：

image.png

压缩列表节点构成

每个压缩列表节点可以保存一个字节数组或者一个整数值。

image.png

previous_entry_length，记录了压缩列表中前一个节点的长度。
encoding，记录了节点的 content 属性所保存的数据类型及长度。
content，保存节点的值。

压缩列表有连锁更新机制，跟上面那个整数集合升级有点像。
previous_entry_length 记录了压缩列表中前一个节点的长度，previous_entry_length 的大小是一个字节，两个字节或者五个字节，根据前一个元素大小有关。但是假如在多小于 254 字节数之前添加一个大于等于 254 字节的数，后续的 previous_entry_length 都要挨个更新长度。

最后

至此 Redis 的底层数据结构就介绍完了，来看下下面这个表，Redis 使用的不同类型队形的编码方式。是不是就很清晰了。

image.png

参考：Redis 设计与实现

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 159,117评论 4赞 362
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,328评论 1赞 293
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,839评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 44,007评论 0赞 206
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,384评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,629评论 1赞 219
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,880评论 2赞 313
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,593评论 0赞 198
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,313评论 1赞 243
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,575评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,066评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,392评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,052评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,082评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,844评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,662评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,575评论 2赞 270

从根儿上理解 Redis（一）

简单动态字符串

SDS 的定义

链表

字典

跳跃表

整数集合

整数集合的升级

压缩列表

压缩列表节点构成

最后

推荐阅读更多精彩内容