Redis 简介
- Redis 全称是 Remote Dictionary Server
- Redis 是一种基于键值对(key-value)的NoSQL数据库,Redis的值可以是由string(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合)、Bitmaps(位图)、HyperLogLog、GEO(地理信息定位)等多种数据结构和算法组成;
- Redis会将所有数据都存放在内存中,所以它的读写性能非常惊人;
- Redis还可以将内存的数据利用快照和日志的形式保存到硬盘上,这样发生类似断电或者机器故障的时候,内存中的数据不会"丢失";
- Redis提供了键过期、发布订阅、事务、流水线、Lua脚本等附加功能。
Redis 特性
速度快 (读写性能 10万/秒)
- Redis的所有数据都是存放在内存中
- Redis是用C语言实现的
- Redis使用了单线程架构,预防了多线程可能产生的竞争问题
基于键值对的数据结构服务器
丰富的功能(键过期、发布订阅实现消息系统)
简单稳定
客户端语言多(支持Redis的客户端语言非常多,Java、PHP、Python、C、C++、Nodejs等)
持久化 (Redis 提供了两种持久化方式:RDB 和 AOF)
主从复制
高可用和分布式
Redis 启动
启动redis-server 到 /home/software/redis-4.0.8/bin 执行 ./redis-server &
启动redis-cli
- dbsize 命令会返回当前数据库中键的总数
- dbsize 命令在计算键总数时不会遍历所有键,而是直接获取Redis内置的键总数变量,所以dbsize命令的时间复杂度是O(1)
- keys 命令会遍历所有键,时间复杂度O(n),当Redis保存了大量键时,线上环境禁止使用
数据结构和内部编码
数据结构
内部编码
单线程架构
- Redis使用了单线程架构和I/O多路复用模型来实现高性能的内存数据库服务
- 因为Redis是单线程来处理命令的,所以一条命令从客户端到服务器不会立刻被执行,所以命令都会进入一个队列中,然后逐个被执行.
为什么单线程还能这么快
- 纯内存访问,Redis将所有数据放在内存中,内存的响应时长大约为100纳秒,这是Redis达到每秒万级别访问的重要基础
- 非阻塞I/O,Redis使用epoll作为I/O多路复用技术的实现,再加上Redis自身的事件处理模型将epoll中的连接、读写、关闭都转换为事件,不在网络I/O上浪费过多的时间
- 单线程避免了线程切换和竞态产生的消耗
字符串 字符串类型是Redis最基本的数据结构,最大值不能超过512MB
setnx 如果有多个客户端同时执行 setnx key value,根据setnx 的特性只有一个客户端能设置成功,setnx可以作为分布式锁的一种实现方案
内部编码
- 字符串类型的内部编码有3中:
- int 8个字节的长整形
- ember 小于等于39个字节的字符串
- raw 大于39个字节的字符串
- Redis 会根据当前值的类型和长度决定使用哪种内部编码实现
哈希
在使用hgetall时,如果哈希元素个数比较多,会存在阻塞Redis的可能;可以使用hscan命令,该命令会渐进式遍历哈希类型
哈希类型的内部编码有两种:
- ziplist(压缩列表): 当哈希类型元素个数小于hash-max-ziplist-entries配置(默认512个)、同时所有值都小于hash-max-ziplist-value配置(默认64字节)时,Redis会使用ziplist作为哈希的内部实现,ziplist使用更加紧凑的解构实现多个元素的连续存储,所以在节省内存方面比hashtable更加优秀
- hashtable(哈希表): 当哈希类型无法满足ziplist的条件时,Redis会使用hashtable作为哈希的内部实现,因为此时ziplist的读写效率会下降,而hashtable的读写事件复杂度为O(1),hashtable 会消耗更多内存
列表
- 列表类型是用来存储多个有序的字符串
- 列表中的每个字符串称为元素(element),一个列表最多可以存储2^32-1个元素
- 列表类型的两个特点:
- 列表中的元素是有序的
- 列表中的元素可以是重复的
- lrange 操作会获取列表指定索引范围所有的元素。索引下标有两个特点:
- 索引下标从左到右分别是0 到 N-1,但是从右到左分别是-1到-N
- lrange 中的end选项包含了自身
- 内部编码:
- ziplist(压缩列表): 当列表的元素个数小于list-max-ziplist-entries 配置(默认512个),同时列表中每个元素的值都小于list-max-ziplist-value配置时(默认64字节),Redis会选用ziplist来作为列表的内部实现来减少内存的使用
- linedlist(链表): 当列表类型无法满足ziplist的条件时,Redis会使用linedlist作为列表的内部实现
集合
- 集合(set)类型也是用来保存多个的字符串元素,集合不允许有重复元素,并且集合中的元素是无序的,不能通过索引下标获取元素
- 一个集合最多可以存储2^32 - 1个元素
- scard 的时间复杂度为O(1),它不会遍历集合所有元素,而是直接用Redis内部的变量
- 内部编码:
- intset(整数集合):当集合中的元素都是整数且元素个数小于set-max-intset-entries配置(默认512个)时,Redis会选用intset来作为集合的内部实现,从而减少内存的使用
- hashtable(哈希表): 当集合类型无法满足intset的条件时,Redis会使用hastable作为集合的内部实现
有序集合
- 有序集合中的元素不能重复,但是score可以重复
- 有序集合相比集合提供了排序字段,但是也产生了代价,zadd的时间复杂度为O(log (n)),sadd的时间复杂度为O(1)
- 有序集合是按照分值排名的,zrange是从低到高返回,zrevrange反之。
- 内部编码:
- ziplist(压缩列表):当有序集合的元素个数小于zset-max-ziplist-entries配置(默认128个),同时每个元素的值都小于zset-max-ziplist-value配置(默认64字节)时,Redis会用ziplist来作为有序集合的内部实现,ziplist可以有效减少内存的使用
- skiplist(跳跃表): 当ziplist条件不满足时,有序集合会使用skiplist作为内部实现,因为此时ziplist的读写效率会下降
数据库管理
- select
- 切换数据库,Redis默认配置中是由16个数据库
- Redis 的分布式实现 Redis Cluster 只允许使用0号数据库
- Redis 是单线程的。如果使用多个数据库,那么这些数据库仍然是使用一个CPU,彼此之前还是会受到影响的
- 多数据库的使用方式,会让调试和运维不同业务的数据库变的困难,假如有一个慢查询存在,依然会影响其他数据库,这样会使得别的业务方定位问题非常的困难
- 部分Redis的客户端根本就不支持这种方式
- dbsize
- flushdb/flushall
- flushdb/flushall 命令用于清除数据库,两者的区别是flushdb值清除当前数据库,flushall会清除所有数据库
- 如果当前数据库键值数量比较多,flushdb/flushall 存在阻塞Redis的可能性