您好,我是南橘,万法仙门的掌门,刚刚从九州世界穿越到地球,因为时空乱流的影响导致我的法力全失,现在不得不通过这个平台向广大修真天才们借去力量。你们的每一个点赞,每一个关注都是让我回到九州世界的助力,兄弟萌来为我注入修为吧!关注WX号:南橘ryc 。
等我回去以后,大家都是万法仙门的长老,我会给大家数不尽的天材地宝,人人如龙,全民飞升。
作为一个仙侠世界的宗门,当然会存在宗门大比这种事情。
而作为我们的主角,李小庚自然也会在其中大放光彩。
万法仙门,宗门三号擂台,筑基组淘汰赛。
“承让!”
轻轻挥了挥衣袖,我们的主角李小庚朝已经飞出擂台的对手点了点头。
“三号擂台比试结束,胜者,云霄殿,李小庚。”裁判面无表情地给李小庚发了一个牌子。
“这人也太赖了吧!”
“草(我爱你)一上台就用法器,完全不给我们这些普通弟子活路啊!”
“云霄殿都是一群狗大户,结丹期的擂台上,云霄殿的二弟子带着炼器宗的oracle大杀四方,没想到这边又是一样的剧情。”
李小庚听到这些议论,嘴角露出一丝无奈的笑容,使用绝技发胶手轻轻整了整发型,望向议论纷纷的观众说道:“谢谢大家的支持,我会继续努力的!”
“不过他好帅啊,我原谅他了。”
“是啊,看到他的脸,这样一想不尊重公平竞技其实也没啥事吧?”
“草只是一种植物而已。”
回到一周前。
云霄殿中,李小庚一如既往的在给云小霄献殷勤。
“师父,下周就是宗门大比了。您天天在万法研究院里搞研究,肯定很累吧,小徒弟来给您松松肩膀。”
云小霄看着满脸谄媚的李小庚,轻哼了一下:“放心,人人都有份,给你Redis行不行?”
“Redis?炼器宗出品,号称能解决大部分分布式问题的神器?”
“没错,如果你想要,那我就要考验考验你。你知道Redis的五种基础数据结构是什么吗?”
“简单,师父,且听我娓娓道来。”
一、Redis基础知识
1、1 String 字符串类型
redis中最基本的数据类型,一个key对应一个value
适用情况:
1、缓存: 经典使用场景,把常用信息,字符串,图片或者视频等信息放到redis中,redis作为缓存层,mysql做持久化层,降低mysql的读写压力。 2.计数器:redis是单线程模型,一个命令执行完才会执行下一个,同时数据可以一步落地到其他的数据源。 3.session:通过redis实现session共享 复制代码
1、2 Hash (哈希)
对于Java中的HashMap,本身是一种KV对结构,如 value={{field1,value1},......fieldN,valueN}},非常好理解
适用情况:
HashMap作为缓存,相比于string更节省空间的维护缓存信息,适合存储如用户信息,视频信息等 复制代码
底层用字典dict实现
1、3 List (链表)
Redis 的链表相当于 Java 语言里面的 LinkedList
适用情况:
1、List在Redis中既可以做队列也可以做栈使用,它的插入和删除操作非常快,时间复杂度为 0(1),但是索引定位很慢,时间 复杂度为 O(n)。 2、可以作为微博的时间轴,有人发布微博,用lpush加入时间轴,展示新的列表信息。 3、可以实现阻塞队列,左进右出的队列组完成设计 复制代码
list底层使用quickList(快速链表)实现
在早期的设计中, 当列表对象中元素的长度比较小或者数量比较少的时候,采用ziplist来存储,当列表对象中元素的长度比较大或者数量比较多的时候,则会转而使用双向列表linkedlist来存储。
这两种存储方式都各有优缺点
- 双向链表linkedlist便于在表的两端进行push和pop操作,在插入节点上复杂度很低,但是它的内存开销比较大。首先,它在每个节点上除了要保存数据之外,还要额外保存两个指针;其次,双向链表的各个节点是单独的内存块,地址不连续,节点多了容易产生内存碎片。
- ziplist存储在一段连续的内存上,所以存储效率很高。但是,它不利于修改操作,插入和删除操作需要频繁的申请和释放内存。特别是当ziplist长度很长的时候,一次realloc可能会导致大批量的数据拷贝。
3.2版本更新之后,list的底层实现变成了quickList
quickList是 zipList 和 linkedList 的混合体,它将 linkedList 按段切分,每一段使用 zipList 来紧凑存储,多个 zipList 之间使用双向指针串接起来。
1、4 Set 集合
Redis 的集合相当于 Java 语言里面的 HashSet ,它内部的键值对是无序的、唯一 的。
它的内部实现相当于一个特殊的字典,字典中所有的 value 都是一个值 NULL 当集合中最后一个元素被移除之后,数据结构被自动删除,内存被回收。 复制代码
适用情况:
1、标签(tag),给用户添加标签,或者用户给消息添加标签,这样有同一标签或者类似标签的可以给推荐关注的事或者关注的人。 2、点赞,或点踩,收藏等,可以放到set中实现 3、可以用来存储在某活动中中奖的用户 ID ,因为有去重功能,可以保证同 一个用户不会中奖两次。 复制代码
1、5 Zset 有序集合
它类似于 Java SortedSet HashMap 的结合体, 方面它是个 set ,保证 了内部 value 的唯性,另方面它可 以给每个 value 赋予一个 score ,代表 这个 value 的排序权重。它的内部实现 用的是一种叫作“跳跃表”的数据 结构。
[图片上传失败...(image-8a0de1-1639382212738)]
从这张图片,我们可以看出来:跳跃表的底层是一个顺序链表,每隔一个节点有一个上层的指针指向下一个节点,并层层向上递归。这样设计成类似树形的结构,可以使得对于链表的查找可以到达二分查找的时间复杂度。
skiplist他不要求上下两层链表之间个数的严格对应关系,他为每个节点随机出一个层数。比如上图第三个节点的随机出的层数是4,那么就把它插入到四层的空间上,而第四个节点随机出的层数是1,那它就只存在第一层空间上。
- 当数据较少的时候,zset是由一个ziplist来实现的,就和list底层之前是一样的
ziplist是由一系列特殊编码的连续内存块组成的顺序存储结构,类似于数组,ziplist在内存中是连续存储的,但是不同于数组,为了节省内存 ziplist的每个元素所占的内存大小可以不同。 ziplist将一些必要的偏移量信息记录在了每一个节点里,使之能跳到上一个节点或下一个节点。
- 当数据较多的时候,zset是一个由dict 和一个 skiplist来实现的,dict用来查询数据到分数的对应关系,而skiplist用来根据分数查询数据
除了这五大基础数据结构,Redis还有更加专业的数据结构 HyperLogLog(基数统计的算法)、Geo(地理位置系列)、Pub\Sub(消息队列)、Pipeline(管道)、BloomFiler(布隆过滤器),都在不同的地方有用到,有些我会在下文向大家介绍。
1、6 Pipeline
可以将多次IO往返时间缩减为一次,前提是pipleline执行的指令之间没有因果关系
管道(pipeline)可以一次性发送多条命令并在执行完后一次性将结果返回,pipeline 通过减少客户端与redis的通信次数来实现降低往返延时时间,而且Pipeline 实现的原理是队列,而队列的原理是时先进先出,这样就保证数据的顺序性。
注意:pipeline机制可以优化吞吐量,但无法提供原子性/事务保障
“哎哟,不错哦,还能举一反三,是不是一早就打起Redis的主意了?”云小霄玩味的盯着李小庚的眼睛.
不过李小庚是何许人物?举世誉之而不加劝,举世非之而不加沮,脸色毫无任何变化:“哪能啊师父,你也知道我除了修炼就是去图书馆了,关于redis的书籍这段时间也是小有涉猎,不信您再考考我?”
“长本事了嘛小庚同学!”云小霄来了兴趣。
当年收李小庚入门的时候,百分之五十(其实是百分之百)是看脸,剩下百分之五十的考量也是他的基础非常扎实,完全不像普通的炼气期。李小庚本人也十分争气,入门半年便突破了筑基期,并且不急不躁,一步一个脚印的践行着万法仙门三年筑基的规划。学习今法,虽然快速的掌握各种先进技能能很快的突破,但是若是没有坚实的基础,那么未来的道路肯定会遇到各种各样的问题。
“那么我来考考你,Redis如何实现分布式锁?”
“我有一言,请诸位静听。”
二、集群与分布式锁
2、1 Redis实现分布式锁
随着互联网技术的飞速发展,越来越多的单体架构已经转型成了分布式架构,,分布式架构确实能带来性能和效率上的提升,但是也会带来数据一致性的问题。
分布式锁,就是解决分布式架构中数据一致性的专用武器,分布式锁需要满足一下三个方面方可放心使用:
排他性:在同一时间只会有一个客户端能获取到锁,其它客户端无法同时获取
避免死锁:这把锁在一段有限的时间之后,一定会被释放(正常释放或异常释放)
高可用:获取或释放锁的机制必须高可用且性能佳
目前,我所知道的分布式锁大概有三种主流方式实现,分别是zookpeer,redis,还有本地数据库,今天我就介绍一下如何用redis实现分布式锁。
基于Redis实现的锁机制,主要是依赖redis自身的原子操作
setnx争抢锁,再用expire添加过期时间
没有看错,就是这么简单,如果害怕不妥,比如争抢锁的时候还没有设置过期时间就突然宕机之类的问题,可以直接用jedis等封装好的RedisTemplate把setnx和expire合成一条指令使用。
“但是这样的分布式锁真的安全吗?如果法器服务器宕机怎么办?”
“当然,这样的单体redis所使用的分布式锁的安全性并不高。”李小庚仿佛知道云小霄会这样问,嘴角不经意泛起一抹微笑。
首先,单点故障的问题不可避免
其次,因为使用锁的客户端,和redis服务器,不在一起啊!时间是有延迟的,我们只能依靠redis的TTL命令来查询锁的剩余时间,然后根据这个剩余时间来判断锁是否超时。
然而在通常的计算机系统中,很难获取到一个可靠的时间。
- 系统可能由于时间服务器同步调整时间,
- 虚拟机可能调整时间,
- JVM GC可能导致时间停顿
RedLock的出现在一定程度上解决了这个问题,它的执行流程如下:
- 客户端获取当前时间,生成一个随机值作为锁的值(目的是更加精确的获得时间)
- 依次尝试在所有5个redis上取得同一个锁(使用类似单机redis锁的方法, 使用同样的key和同一个随机值)
获取锁的操作本身需要设定一个比较小的超时时间(如5-50ms), 防止在一个挂掉的redis上浪费太多时间
如果一个redis不可用,要尽快开始尝试下一个- 客户端计算获取锁一共用了多长时间,通过用当前时间减去第1步得到的时间
如果客户端获取了多数redis上的这个锁(3到五个5),并且这时还没有超过锁的超时时间,
这个锁就算是获取成功了- 如果锁获取成功了,有效时间就按锁超时时间-获取锁花费时间算
- 如果失败,尝试在所有redis上解除锁
(解除锁的操作是一段lua script,删除一个key如果key的value是第1步生成的随机值)当然,它也不能解决问题,但是, redis锁只会在比较极端的情况下出错,如果不是需要特别精确,只需要保证绝大多数可靠的时候,可以放心使用redis集群或者redlock。
“你说你使用RedLock工具,那么我直接击毁你的redis单体怎么办?你还如何保持分布式锁的健壮性?而且我们的万法玄天阵也是用到了分布式锁来确保出入弟子的身份ID不被盗用,按你的方式来使用,如果结果不够精确,那对于其他门派来说咱的阵法就和筛子没有区别了。”云小霄挥手从殿内的盆栽上弄来了几个小橘子,望向了第三面墙外的各位,好像在提示大家可以喝口水动一动了。
“那么,就要提到Redis集群了。”李小庚推了推眼镜。
2、2Redis集群
集群同步机制
Redis中有主从机制,一个主节点对应一个或多个从节点,主节点提供数据存取,从节点则是从主节点拉取数据备份,当这个主节点挂掉后,就会有这个从节点选取一个来充当主节点,从而保证集群不会挂掉。先讲一下Redis主从同步的流程:
- 1.第一次同步时,从服务器向主服务器发送一次SYNC命令,主服务器收到之后做一次bgsave、并同时将后续修改操作记录到内存buffer,待完成后将RDB文件全量同步到复制节点
- 2.复制节点接收完成后将RDB镜像加载到内存中,加载完成后,再通知主节点
- 3.后续的增量数据通过AOF日志同步即可,有点类似数据库的binlog
同时,在2.8版本之后,Redis可以自动判断是需要全量同步还是增量同步,效率比较高,增量同步其实就是在完成全量同步后,开始新复制时向主服务器发送PSYNC(<runid> <offset>)命令(runid是上次复制的主服务器id,offset是从服务器的复制偏移量),主服务器会根据这个两个参数来决定做哪种同步,判断服务器id是否和本机相同,复制偏移量是否在缓冲区中。
高可用性:
- Redis Sentinal(哨兵模式)集群着眼于高可用,在master宕机时自动将slave提升为master,继续提供服务
- Redis Cluster集群着眼于扩展性,在单个redis内存不足时,使用Cluster进行分片存储
“原来是在这里等着我呢。李小庚,如果我给你一套redis集群,你如何去实现你所设想的方案呢?”云小霄笑出了声,本来只想给一个单体redis法器,再凭借李小庚自己的扎实的基础,就有希望在筑基期大比上夺魁的,没想到他的目标一直都是redis集群。
“不急不急,我从书中看到了三套实现redis集群的方案,还请师父帮忙演示一二。”李小庚也知道云小霄知道了自己的目的,纵使脸皮再厚也开始微微泛红,配上一双剑眉下一对细长的桃花眼,云小霄的口水不争气的流了下来。
云小霄伸了伸懒腰,然后单手指天:“剑来!”。
无数红白相间细小飞剑从房间的各个角落出现并环绕在她的身边,这边是李小庚一直心心念念的redis集群了。
“接下来集群的指挥权交给你,看你表演咯~”
李小庚学有样学样:“今日我李小庚便要重回陆地神仙之境。”
三、Redis集群的实现
3、1传统的主从模式
大概是所有的集群都有主从模式
主从模式的一个作用是备份数据,这样当一个节点损坏(指不可恢复的硬件损坏)时,数据因为有备份,可以方便恢复。
另一个作用是负载均衡,所有客户端都访问一个节点肯定会影响Redis工作效率,有了主从以后,查询操作就可以通过查询从节点来完成。在主从模式中,一个Master可以有多个Slaves,默认配置下,master节点可以进行读和写,slave节点只能进行读操作,无法进行写操作。
如果修改默认配置,可以让slave进行写,但是这毫无意义,因为写入的数据不会同步给其他slave,同时,master节点如果修改了,slave上的数据会马上被覆盖。
slave节点挂了不影响其他slave节点的读和master节点的读和写,重新启动后会将数据从master节点同步过来。master节点挂了以后,不影响slave节点的读,Redis将不再提供写服务,master节点启动后Redis将重新对外提供写服务。
所以,我们可以发现Redis的主从和Zookeeper的主从完全不一样!它竟然不会选举!
这个缺点影响是很大的,尤其是对生产环境来说,是一刻都不能停止服务的,所以一般的生产坏境是不会单单只有主从模式的。所以有了下面的sentinel模式。
3、2sentinel模式(哨兵模式)
哨兵模式要搭配主从模式来使用,主从不能自己选举,那我们就加一个哨兵,当sentinel发现master节点挂了以后,sentinel就会从slave中重新选举一个master。
哨兵的作用就是监控Redis系统的运行状况。它的功能包括以下两个。
(1)监控主服务器和从服务器是否正常运行。 (2)主服务器出现故障时自动将从服务器转换为主服务器。
这不就皆大欢喜了吗?
哨兵的工作方式:
- 1、每个Sentinel(哨兵)进程以每秒钟一次的频率向整个集群中的Master主服务器,Slave从服务器以及其他Sentinel(哨兵)进程发送一个 PING 命令。
- 2、如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel(哨兵)进程标记为主观下线(SDOWN)
- 3、如果一个Master主服务器被标记为主观下线(SDOWN),则正在监视这个Master主服务器的所有 Sentinel(哨兵)进程要以每秒一次的频率确认Master主服务器的确进入了主观下线状态
当有足够数量的 Sentinel(哨兵)进程(大于等于配置文件指定的值)在指定的时间范围内确认Master主服务器进入了主观下线状态(SDOWN), 则Master主服务器会被标记为客观下线(ODOWN)- 4、在一般情况下, 每个 Sentinel(哨兵)进程会以每 10 秒一次的频率向集群中的所有Master主服务器、Slave从服务器发送 INFO 命令。
当Master主服务器被 Sentinel(哨兵)进程标记为客观下线(ODOWN)时,Sentinel(哨兵)进程向下线的 Master主服务器的所有 Slave从服务器发送 INFO 命令的频率会从 10 秒一次改为每秒一次。- 5、若没有足够数量的 Sentinel(哨兵)进程同意 Master主服务器下线, Master主服务器的客观下线状态就会被移除。若 Master主服务器重新向 Sentinel(哨兵)进程发送 PING 命令返回有效回复,Master主服务器的主观下线状态就会被移除。
sentinel模式基本可以满足一般生产的需求,具备高可用性。但是当数据量过大到一台服务器存放不下的情况时,主从模式或sentinel模式就不能满足需求了,这个时候需要对存储的数据进行分片,将数据存储到多个Redis实例中,这就是cluster模式。
3、3cluster模式
cluster的出现是为了解决单机Redis容量有限的问题,将Redis的数据根据一定的规则分配到多台机器。
Redis-Cluster采用无中心结构,它的特点如下:
所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽。
节点的失效是通过集群中超过半数的节点检测失效时才生效。
客户端与redis节点直连,不需要中间代理层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可。
cluster可以说是sentinel和主从模式的结合体,通过cluster可以实现主从和master重选功能,所以如果配置三个副本三个分片的话,就需九六个Redis实例。
因为Redis的数据是根据一定规则分配到cluster的不同机器的,当数据量过大时,可以新增机器进行扩容,这种模式适合数据量巨大的缓存要求,当数据量不是很大使用sentinel即可。引用一张大佬的图片来直观展现一下什么是 Redis-Cluster
image每个请求访问Redis-Cluster集群的时候,都会进行一个路由,路由可以通过Hash(也可以用别的)来进行随机分片,但是如果完全hash的话很可能导致分片们旱的旱死,涝的涝死。,所以,提出了一致性哈希(自动缓存迁移)+虚拟节点(自动负载均衡)的方法来解决问题
一致性哈希的原理 :将所有master node落在一个圆环上面,然后,有一个key过来之后。同样就是hash值,然后会用hash值在圆环对应的各个点上(每个点都有一个hash值)去对比,看hash值落在那个位置,落在圆环上面以后,就会顺时针旋转去寻找距离自己最近的一个节点,数据的存储于读取都在该节点进行。
一致性哈希的优势 :保证了任何一个master宕机,只会影响之前在那个master上面的数据,因为照着顺时针走,全部在之前的master上面找不到了,master也宕机了,就会继续顺着顺时针走到下一个master节点去。这样就只会有一部分数据丢失。
在李小庚的指挥下,reids集群也慢慢的变成了他的模样,一会儿在空中变成,一会儿变成,好不快乐。
“不要急,小庚,除此之外,关于redis还有一些其他的东西你需要掌握。”
四、Redis进阶知识
4、1异步队列
Redis的本职工作是缓存,但是由于它多才多艺,成为队列也不错,有一些阻塞式的API让其有能力做消息队列;另外,做消息队列的其他特性例如FIFO(先入先出)也很容易实现,只需要一个List对象从头取数据,从尾部塞数据即可
- 在Redis中,如果让List结构作为队列、rpush生产消息、lpop消费消息、当lpop没有消息的时候,可以当sleep一会再重试,这就相当于生产者消费模式模式了。同时List有个指令叫blpop,在没有消息的时候,它会阻塞住直到消息到来。
- pub\sub主题订阅者模式、可以实现1对N的消息队列,实现生产一次,消费多次。但是,它也有不足之处,如果让pub\sub主题订阅者模式、消费者下线的情况下,消息会丢失、不如直接用MQ
4、2延时队列
在Redis中,可以利用 sorted-set 来做延时队列
zadd key score1 value1 score2 value2
- socre为执行时间,key为队列名,value为数据
- 消费队列循环从sorted-set根据score获取(zrangebyscore)小于等于当前时间的且score最小的一条数据轮询处理
- 如果没有取到数据,睡一会再去获取
但是,Redis的延时队列无法返回ACK,所以需要自己实现
4、3 持久化
Redis有两种持久化的方式,分别是RDB和AOF
RDB做镜像全量持久化、AOF做增量持久化,因为RDB会耗费较长时间,不够实时,在停机的时候会导致大量有效数据丢失,所以需要AOF来配合使用,在redis实例重启时,会使用RDB持久化文件重新构建内存,再使用AOF重放近期的操作指令来实现完整恢复重启之前的状态。
RDB机制
RDB持久化是指在指定的时间间隔内将内存中的数据集快照写入磁盘。也是默认的持久化方式,这种方式是就是将内存中数据以快照的方式写入到二进制文件中,默认的文件名为dump.rdb。RDB提供了三种机制来触发持久化
1、save触发方式---客户端发起save请求
执行save命令期间,Redis不能处理其他命令,直到RDB过程完成为止
2、bgsave触发方式--客户端发起bgsave请求
执行该命令时,Redis会在后台异步进行快照操作,快照同时还可以响应客户端请求
3、自动触发
自动触发是由我们的配置文件来完成的,在redis.conf文件中配置,大家可以去了解一下,这里就不写那么多东西了
AOF机制
全量备份总是耗时的(随机的传说总是好的???),有时候我们提供一种更加高效的方式AOF,Redis会将每一个收到的写命令都通过write函数追加到文件中,就是日志记录。
和RDB一样,AOF也有三种同步机制:
- 1、always:同步持久化 每次发生数据变更会被立即记录到磁盘 性能较差但数据完整性比较好
- 2、everysec:每秒同步,异步操作,每秒记录 如果一秒内宕机,有数据丢失
- 3、no:从不同步
Redis本身的机制是AOF持久化开启存在AOF文件时,优先加载AOF文件。AOF文件不存在时候,加载RDB文件。加载AOF\RDB文件后,Redis启动成功。AOF\RDB文件存在错误时,Redis启动失败并打印错误信息。
不要问AOF和RDB用哪个,我的经验就是,全都用。 RDB同步快,但是要损失最多五分钟的内容,AOF同步慢,但是每秒同步的情况下最多损失1s的内容,损失的内容也可以通过日志去找回。
解决机器断电对数据丢失的影响
AOF日志中可以进行sync属性的配置,如果不要求性能,在每条写指令时都sync一下磁盘,就不会丢失数据,但在高性能要求下每次都sync是不现实的,一般都使用定时sync,比如1s一次,这个时候就最多丢失1s的数据。