登录注册写文章

Redis 常用数据结构及内部编码

西葫芦炒胖子

Redis 常用数据结构及内部编码

Redis 简介

Redis 全称是 Remote Dictionary Server
Redis 是一种基于键值对(key-value)的NoSQL数据库，Redis的值可以是由string(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合)、Bitmaps(位图)、HyperLogLog、GEO(地理信息定位)等多种数据结构和算法组成；
Redis会将所有数据都存放在内存中，所以它的读写性能非常惊人；
Redis还可以将内存的数据利用快照和日志的形式保存到硬盘上，这样发生类似断电或者机器故障的时候，内存中的数据不会"丢失";
Redis提供了键过期、发布订阅、事务、流水线、Lua脚本等附加功能。

Redis 特性

速度快 (读写性能 10万/秒)
- Redis的所有数据都是存放在内存中
- Redis是用C语言实现的
- Redis使用了单线程架构，预防了多线程可能产生的竞争问题
基于键值对的数据结构服务器
丰富的功能(键过期、发布订阅实现消息系统)
简单稳定
客户端语言多(支持Redis的客户端语言非常多,Java、PHP、Python、C、C++、Nodejs等)
持久化 (Redis 提供了两种持久化方式:RDB 和 AOF)
主从复制
高可用和分布式

Redis 启动

启动redis-server 到 /home/software/redis-4.0.8/bin 执行 ./redis-server &
redis_server.png

启动redis-cli
redis_cli.png

- dbsize 命令会返回当前数据库中键的总数
- dbsize 命令在计算键总数时不会遍历所有键，而是直接获取Redis内置的键总数变量，所以dbsize命令的时间复杂度是O(1)
- keys 命令会遍历所有键，时间复杂度O(n),当Redis保存了大量键时，线上环境禁止使用

数据结构和内部编码

数据结构
data_set.png

内部编码
redis_encoding.png

单线程架构

Redis使用了单线程架构和I/O多路复用模型来实现高性能的内存数据库服务
因为Redis是单线程来处理命令的，所以一条命令从客户端到服务器不会立刻被执行，所以命令都会进入一个队列中，然后逐个被执行.

为什么单线程还能这么快

纯内存访问，Redis将所有数据放在内存中，内存的响应时长大约为100纳秒，这是Redis达到每秒万级别访问的重要基础
非阻塞I/O，Redis使用epoll作为I/O多路复用技术的实现，再加上Redis自身的事件处理模型将epoll中的连接、读写、关闭都转换为事件，不在网络I/O上浪费过多的时间
单线程避免了线程切换和竞态产生的消耗

字符串字符串类型是Redis最基本的数据结构,最大值不能超过512MB

setnx 如果有多个客户端同时执行 setnx key value，根据setnx 的特性只有一个客户端能设置成功，setnx可以作为分布式锁的一种实现方案
内部编码
- 字符串类型的内部编码有3中：
- 1. int 8个字节的长整形
- 1. ember 小于等于39个字节的字符串
- 1. raw 大于39个字节的字符串
- Redis 会根据当前值的类型和长度决定使用哪种内部编码实现
string_encoding.png

哈希

在使用hgetall时，如果哈希元素个数比较多，会存在阻塞Redis的可能；可以使用hscan命令，该命令会渐进式遍历哈希类型
哈希类型的内部编码有两种：
- 1. ziplist(压缩列表): 当哈希类型元素个数小于hash-max-ziplist-entries配置(默认512个)、同时所有值都小于hash-max-ziplist-value配置(默认64字节)时，Redis会使用ziplist作为哈希的内部实现，ziplist使用更加紧凑的解构实现多个元素的连续存储，所以在节省内存方面比hashtable更加优秀
- 1. hashtable(哈希表): 当哈希类型无法满足ziplist的条件时，Redis会使用hashtable作为哈希的内部实现，因为此时ziplist的读写效率会下降，而hashtable的读写事件复杂度为O(1),hashtable 会消耗更多内存

列表

列表类型是用来存储多个有序的字符串
列表中的每个字符串称为元素(element),一个列表最多可以存储2^32-1个元素
列表类型的两个特点:
- 列表中的元素是有序的
- 列表中的元素可以是重复的
lrange 操作会获取列表指定索引范围所有的元素。索引下标有两个特点：
- 1. 索引下标从左到右分别是0 到 N-1，但是从右到左分别是-1到-N
- 1. lrange 中的end选项包含了自身
内部编码：
- 1. ziplist(压缩列表): 当列表的元素个数小于list-max-ziplist-entries 配置(默认512个)，同时列表中每个元素的值都小于list-max-ziplist-value配置时(默认64字节),Redis会选用ziplist来作为列表的内部实现来减少内存的使用
- 1. linedlist(链表): 当列表类型无法满足ziplist的条件时，Redis会使用linedlist作为列表的内部实现

集合

集合(set)类型也是用来保存多个的字符串元素，集合不允许有重复元素，并且集合中的元素是无序的，不能通过索引下标获取元素
一个集合最多可以存储2^32 - 1个元素
scard 的时间复杂度为O(1),它不会遍历集合所有元素，而是直接用Redis内部的变量
内部编码：
- 1. intset(整数集合)：当集合中的元素都是整数且元素个数小于set-max-intset-entries配置(默认512个)时，Redis会选用intset来作为集合的内部实现，从而减少内存的使用
- 1. hashtable(哈希表): 当集合类型无法满足intset的条件时，Redis会使用hastable作为集合的内部实现

有序集合

有序集合中的元素不能重复，但是score可以重复
有序集合相比集合提供了排序字段，但是也产生了代价，zadd的时间复杂度为O(log (n)),sadd的时间复杂度为O(1)
有序集合是按照分值排名的，zrange是从低到高返回，zrevrange反之。
内部编码：
- 1. ziplist(压缩列表)：当有序集合的元素个数小于zset-max-ziplist-entries配置(默认128个)，同时每个元素的值都小于zset-max-ziplist-value配置(默认64字节)时，Redis会用ziplist来作为有序集合的内部实现，ziplist可以有效减少内存的使用
- 1. skiplist(跳跃表): 当ziplist条件不满足时，有序集合会使用skiplist作为内部实现，因为此时ziplist的读写效率会下降

数据库管理

select
- 切换数据库，Redis默认配置中是由16个数据库
- Redis 的分布式实现 Redis Cluster 只允许使用0号数据库
- 1. Redis 是单线程的。如果使用多个数据库，那么这些数据库仍然是使用一个CPU，彼此之前还是会受到影响的
- 1. 多数据库的使用方式，会让调试和运维不同业务的数据库变的困难，假如有一个慢查询存在，依然会影响其他数据库，这样会使得别的业务方定位问题非常的困难
- 1. 部分Redis的客户端根本就不支持这种方式
dbsize
flushdb/flushall
- flushdb/flushall 命令用于清除数据库，两者的区别是flushdb值清除当前数据库，flushall会清除所有数据库
- 如果当前数据库键值数量比较多，flushdb/flushall 存在阻塞Redis的可能性

最后编辑于：2019.08.04 00:56:17

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Redis基础知识总结
本文为笔者对在学习Redis过程中所收集资料的一个总结，目的是为了以后方便回顾相关的知识,大部分为非原创内容。特此...
EakonZhao阅读 14,637评论 0赞 9
Redis的内存优化
Redis的内存优化声明：本文内容来自《Redis开发与运维》一书第八章，如转载请声明。 Redis所有的数据都...
meng_philip123阅读 19,076评论 2赞 29

Redis基础知识点面试手册
本文精心整理了书籍、博客以及本人面试中遇到的基础知识点，方便大家快速回顾知识。参考： https://githu...
蛮三刀酱阅读 1,013评论 0赞 4
Redis内存优化
参考来源 Redis的内存优化 Redis所有的数据都在内存中，而内存又是非常宝贵的资源。对于如何优化内存使用一直...
秦汉邮侠阅读 1,371评论 0赞 2
Redis入门到精通——数据类型（入门）
Redis 是一个键值对数据库（key-value DB），数据库的值可以是字符串、集合、列表等多种类型的对象，而...
吴昂_ff2d阅读 3,743评论 0赞 5

友情链接更多精彩内容

赞1赞

赞赏

手机看全文