最近学习付磊、张益军两位搜狐大神的《Redis开发与运维》,开始了Redis入门(入坑)之路。众所周知,Redis作为基于键值对的NoSQL数据库,具有高性能、丰富的数据结构、持久化、高可用、分布式等特性,同时Redis本身非常稳定,得到业务的广泛认可和使用。掌握Redis已经逐步成为开发和运维人员的必备技能之一。
本文从初识、特性、使用场景进行Redis讲解。
初识Redis
Redis(Remote Dictionary Server)是一种基于键值对(key-value)的NoSQL数据库,Redis中的值可以是有string(字符串)、hash(哈希)、list(列表)、set(集合)、zset(有序集合)、Bitmaps(位图)、HyperLogLog、GEO(地理信息定位)等多种数据结构和算法组成,因此Redis可以满足很多应用场景,而且因为Redis会将所有数据都存放在内存中,所以读写性能非常惊人。
2008年,Redis作者Salvatore Sanfilippo在开发一个叫LLOOGG的网站,需要实现一个高性能的队列功能,最开始是使用MYSQL来实现,但后来发现无论怎么优化SQL都很难将网站性能提高上去,加上他自己囊中羞涩(一般人是贫穷限制了想象力,大神是贫穷激发了想象力),于是他决定自己做一个专属于LLOOGG的数据库,也就是Redis的前身。
目前从Redis的官方公司统计来看,有很多大公司在使用Redis,如国外的Twitter、Stack Overflow、GitHub等,国内就更多了,如果从体量来统计,新浪微博可以说是全球最大的Redis使用者,还有像阿里巴巴、腾讯、百度、优酷土豆等公司都是Redis的使用者。
熟悉使用和运维Redis已经成为开发运维人员的一个必要技能。
Redis特性
速度快
Redis官方给出Redis读写性能可以达到10万/秒,不过这也取决于机器性能。暂且抛开机器性能差异,只讨论分析Redis速度飞快的原因,大致归纳一下四点:
1、Redis的所有数据都是存放在内存中;
2、Redis是用C语言实现的。一般来说,C语言实现的程序“距离”操作系统更近,执行速度相对会更快;
3、Redis是采用了单线程架构,预防了多线程可能产生的竞争问题;
4、作者对Redis源码不断打磨。
基于键值对的数据结构服务器
几乎所有编程语言都提供了类似字典Dictionary的功能,比如Java中的map、Python中的dict,类似这种组织数据的方式叫做基于键值的方式。与很多键值对数据库不同的是,Redis中的值不仅可以是字符串,而且还可以是具体的数据结构,这样不仅能便于在许多应用场景的开发,同时也能够提高开发效率。
功能丰富
Redis提供了很多额外的功能:
1、提供了键过期功能,用来实现缓存;
2、提供了发布订阅功能,用来实现消息系统;
3、支持Lua脚本功能,可以利用Lua创造出新的Redis命令;
4、提供了简单的事务功能,能在一定程度上保证事务特性(ACID);
5、提供了流水线(PipeLine)功能,能将一批命令一次性传到Redis,减少了网络开销。
简单稳定
首先,Redis源码很少,早期版本代码只有2W行左右,3.0版本之后添加了集群特性,代码增致5W行左右,相对于很多NoSQL数据库来说,代码量要少很多。其次,Redis使用单线程模型,这样不仅使得Redis服务端处理模型变得简单,并且也使得客户端开发变得简单。最后,Redis不需要依赖于操作系统中的类库。
客户端语言多
Redis提供了简单的TCP通信协议,很多编程语言可以很方便接入到Redis,并且由于Redis受到社区和各大公司的广泛认可,所以支持很友好,几乎涵盖了主流的编程语言。
持久化
通常来说,将数据放在内存中是不安全的,一旦断电或者机器故障,重要的数据可能就会丢失。因此Redis提供了两种持久化方式:RDB和AOF,即可以使用两种策略将内存的数据保存到硬盘中,这样就保证了数据的可持久性。
主从复制
Redis提供了复制功能,实现了多个相同数据的Redis副本,复制功能是分布式Redis的基础。
高可用和分布式
Redis从2.8版本正式提供了高可用实现Redis Sentinel,它能够保证Redis节点的故障发现和故障自动转移。Redis从3.0版本正式提供了分布式实现Redis Cluster,它是Redis真正的分布式实现,提供了高可用、读写和容量的扩展性。
Redis使用场景
Redis可以做什么
1、缓存
缓存机制几乎在所有大型网站都有使用,合理使用缓存不仅可以加快数据的访问速度,而且能够有效地降低后端数据源的压力。Redis提供了键值过期时间设置,并且也提供了灵活控制最大内存和内存溢出后的淘汰策略。
2、排行榜系统
比如按照热度排名的排行榜,按照发布时间的排行榜,按照各种复杂维度计算出的排行榜,Redis提供了列表和有序集合数据结构,合理地使用这些数据结构可以很方便地构建各种排行榜系统。
3、计数器应用
计数器在网站中的作用相当重要,例如视频网站有播放数、电商网站有浏览数,为了保证数据的实时性,每一次播放浏览都要做+1的操作,如果并发量很大对于传统关系型数据的性能是一种挑战。Redis天然支持计数功能而且计数性能非常好,是计数器系统的重要选择。
4、社交网络
点赞、粉丝、共同好友、推送、下拉刷新等是社交网络的必备功能,由于社交网站访问量通常比较大,而且传统关系型数据不太适合保存这种类型的数据,Redis提供的数据结构可以较为容易地实现这些功能。
5、消息队列
消息队列系统可以说是一个大型网站的必备基础组件,因为其具有业务解耦、非实时业务削峰等特性。Redis提供了发布订阅和阻塞队列,虽然和专业的消息队列kafka等,还不够强大,但对于一般的基本可以满足。
Redis不可以做什么
聊完了Redis厉害之处,也要注意Redis并不是万金油,有适合用它解决的问题,也有不适合用它解决的。从数据规模和数据冷热这两个角度来分析一下。
站在数据规模的角度来看,数据可以分为大规模数据和小规模数据。Redis的数据是存放在内存中的,虽然现在内存已经足够便宜,但是如果数据量非常大,比如每天有过亿的用户行为数据,使用Redis来存储的话,基本上是无底洞,经济成本相当高。
站在数据冷热的角度来看,数据分为热数据和冷数据,热数据通常是指需要频繁操作的数据,反之,则是冷数据。例如对于视频网站来说,视频基本信息基本上在各个业务线都是经常要操作的数据,而用户的观看记录不一定是经常需要访问的数据,这里暂且不讨论两者数据规模的差异,单纯站在数据冷热的角度上看,视频信息属于热数据,用户观看记录属于冷数据。如果将这些冷数据放在Redis中,无疑是内存浪费,但是对于一些热数据,可以将其放在Redis中加速读写,也可以减轻后端存储的负载,可以说是事半功倍。