Redis 介绍
Redis
是一个Key-Value
存储系统。和Memcached
类似,但它支持存储的value
类型相对更多,包括string
(字符串)、list
(链表)、set
(集合)和zset
(有序集合)。这些数据类型都支持push
/pop
、add
/remove
及取交集
、并集
和差集
及更丰富的操作,而且这些操作都是原子性的。
在此基础上,Redis
支持各种不同方式的排序。与memcached
一样,为了保证效率,数据都是缓存在内存中。区别的是Redis
会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave
(主从)同步。
Key-Value存储系统简介
Key-Value
是当下比较流行的话题,尤其在构建诸如搜索引擎
、IM
、P2P
、游戏服务器
、SNS
等大型互联网应用以及提供云计算服务的时候,怎样保证系统在海量数据环境下的高性能
、高可靠性
、高扩展性
、高可用性
、低成本
成为所有系统架构者们挖空心思考虑的重点,而怎样解决数据库服务器性能瓶颈是最大的挑战。
根据分布式领域的CAP
理论衡量,传统的关系型数据库ACID只满足了CA,因此在P上就很难做得好,另外传统的关系型数据库处理海量数据、分布式架构时在Performance
、Scalability
、Availability
等方面也存在很大的局限性。
而Key-Value Store更加注重对海量数据存取的性能、分布式、扩展性支持上,并不需要传统关系型数据库的一些特征,例如:Schema、事务、完整SQL查询支持等等,因此在分布式环境下的性能相对于传统的关系型数据库有较大的提升。
Key-Value数据库分为很多种类,比如:Voldermort、Dynamo、memcachedb、Cassandra、memcached、Hypertable等,这些Key-Value数据库,有的是用C/C++,有的使用Java,还有的使用Erlang编写的,每个都有自己的独到之处。
为什么选择Key-Value Store
大量的互联网用户选择Key-Value Store的原因具体是下面两个主要原因:
大规模的互联网应用,对于大型互联网企业提供的服务,带来的是大量的数据吞吐量,在同一时间可能会并发的有成千上万的连接对数据库进行操作。在这种情况下,单台服务器或者几台服务器远远不能满足这些数据处理的需求,简单的升级服务器性能这样的scale up的方式也不行,所以唯一可以采用的办法就是scale out了。Scale out 的方法有很多种,但大致分为两类:一类仍然采用RDBMS,然后通过对数据库的垂直和水平切割将整个数据库部署到一个集群上,这种方法的优点在于可以采用RDBMS这种熟悉的技术,但缺点在于它是针对特定应用的,就是说,由于应用的不同,切割的方法是不一样的。还有一类就是google所采用的方法,抛弃RDBMS,采用key-value形式的存储,这样可以极大的增强系统的可扩展性,如果要处理的数据持续增大,多加机器就可以了。事实上,key-value的存储就是由于BigTable等相关论文的发表慢慢进入人们的视野的。
云存储
如果说上一个问题还有可以替代的解决方案(切割数据库)的话,那么对于云存储来说,也许key-value的store就是唯一的解决方案了。云存储简单点来说,就是构建一个大型的存储平台给别人用,这也就意味着在这上面运行的应用其实是不可控的。如果其中某个客户的应用随着用户的增长而不断增长时,云存储提供商是没有办法通过数据库的切割来达到scale的,因为这个数据是客户的,供应商不了解这个数据自然就没有办法切割。在这种情况下,key-value的store就是唯一的选择了,因为这种条件下的scalability必须是自动完成的,不能有人工干预。这也是为什么几乎所有的云存储都是key-value形式的,例如Amazon的smipleDB,底层实现就是key-value,还有GoogleAppEngine,采用的是BigTable的存储形式。也许唯一可能例外的是MS的解决方案,在Qcon大会上听说MS的Azure平台的下一个版本就会推出基于RDBMS的云存储,今晚本人任然对此表示怀疑。
key-value Store最大的特点就是它的可扩展性,所谓的扩展性,我认为包含了两方面内容。一方面是指key-value Store可以支持极大的数据的存储,它的分布式的架构决定了只要有更多的机器,就能够保证存储更多的数据。另一方面,是指它可以支持数量很多的并发的查询。对于RDBMS,一般几百个并发的查询就可以让它很吃力了,而一个key-value Store,可以很轻松的支持上千的并发查询。
总结key-value Store的一些特点:
- key-value store:一个key-value数据存储系统,只支持一些基本的操作,如set(key,value)和get(key)等;
- 分布式:多台机器(nodes)同时存储数据和状态,彼此交换消息来保持数据一致,可视为一个完整的存储系统。
- 数据一致:所有机器上的数据都是同步更新的、不用担心得到不一致的结果
- 冗余:所有机器(nodes)保存相同的数据,整个系统的存储能力取决于单台机器(node)的能力。
- 容错:如果有少数nodes出错,比如重启、宕机、断网、网络丢包等各种fault、fail都不影响整个系统的运行;
- 高可靠性:容错、冗余等保证了数据库系统的可靠性。
Redis实际应用案例
目前全球最大的Redis用户是新浪微博,在新浪有200多台物理机,400多个端口正在运行着Redis, 有+4G的数据跑在Redis上来为微博用户提供服务。
在新浪微博Redis的部署场景很多,大概分为如下的2种:
第一种是应用程序直接访问Redis数据库
第二种是应用程序直接访问Redis,只有当Redis访问失败时才访问MySQL
同时,Digg的一项新功能,添加了对文章浏览数的显示,这一功能的一大卖点是其实时性。而支持此实时浏览量计数的,正是Redis。
初识Redis
Redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。从2010年3月15日起,Redis的开发工作由VMware主持。
数据类型
作为Key-value型数据库,Redis也提供了键(Key)和键值(Value)的映射关系。但是,除了常规的数值或字符串,Redis的键值还可以是以下形式之一:
- Lists (列表)
- Sets (集合)
- Sorted sets (有序集合)
- Hashes (哈希表)
键值的数据类型决定了该键值支持的操作。Redis支持诸如列表、集合或有序集合的交集、并集、查集等高级原子操作;同时,如果键值的类型是普通数字,Redis则提供自增等原子操作。
持久化
通常,Redis将数据存储于内存中,或被配置为使用虚拟内存。通过两种方式可以实现数据持久化:使用截图的方式,将内存中的数据不断写入磁盘;或使用类似MySQL的日志方式,记录每次更新的日志。前者性能较高,但是可能会引起一定程度的数据丢失;后者相反。
主从同步
Redis支持将数据同步到多台从库上,这种特性对提高读取性能非常有益。
性能
相比需要依赖磁盘记录每个更新的数据库,基于内存的特性无疑给Redis带来了非常优秀的性能。读写操作之间有显著的性能差异。
适用场合
毫无疑问,Redis开创了一种新的数据存储思路,使用Redis,我们不用在面对功能单调的数据库时,把精力放在如何把大象放进冰箱这样的问题上,而是利用Redis灵活多变的数据结构和数据操作,为不同的大象构建不同的冰箱。希望你喜欢这个比喻。
缓存 这个不必说了,性能优于Memcached,数据结构更多样化。
安装Redis
这里参考博客: Redis在Linux环境下安装
将Redis作为 Linux 服务随机启动 vi /etc/rc.local, 使用vi编辑器打开随机启动配置文件,并在其中加入下面一行代码 redis-server的启动文件的绝对路径
简单操作数据库;
- 插入数据:
redis 127.0.0.1:6379> set name wwl OK
- 查询数据:
redis 127.0.0.1:6379> get name "wwl"
- 删除数据:
redis 127.0.0.1:6379> del name
- 验证键是否存在
redis 127.0.0.1:6379> exists name (integer) 0
其中0,代表此key不存在;1代表存在