一、环境介绍
操作系统:centos 7.2
redis版本:3.2.6
节点分布:部署6个redis节点,3主3从,分别安装在6台物理机上。
node-1:192.168.100.200 node-1.conf
node-2:192.168.100.201node-2.conf
node-3:192.168.100.202node-3.conf
node-4:192.168.100.203node-4.conf
node-5:192.168.100.204node-5.conf
node-6:192.168.100.205node-6.conf
二、Redis Cluster架构
1.1、redis cluster 架构
1)redis-cluster架构图
架构细节:
(1)所有的redis节点彼此互联(PING-PONG机制),内部使用二进制协议优化传输速度和带宽.
(2)节点的fail是通过集群中超过半数的节点检测失效时才生效.
(3)客户端与redis节点直连,不需要中间proxy层.客户端不需要连接集群所有节点,连接集群中任何一个可用节点即可
(4)redis-cluster把所有的物理节点映射到[0-16383]slot上,cluster 负责维护node<->slot<->value
2) redis-cluster选举:容错
(1)领着选举过程是集群中所有master参与,如果半数以上master节点与master节点通信超过(cluster-node-timeout),认为当前master节点挂掉.
(2)什么时候整个集群不可用(cluster_state:fail),当集群不可用时,所有对集群的操作做都不可用,收到((error) CLUSTERDOWN The cluster is down)错误
a:如果集群任意master挂掉,且当前master没有slave.集群进入fail状态,也可以理解成进群的slot映射[0-16383]不完成时进入fail状态.
b:如果超过集群半数以上master挂掉,无论是否有slave集群进入fail状态.
3)redis cluster节点分配
现在我们是三个主节点分别是:A, B, C 三个节点,它们可以是一台机器上的三个端口,也可以是三台不同的服务器。那么,采用哈希槽 (hash slot)的方式来分配16384个slot 的话,它们三个节点分别承担的slot 区间是:
节点A覆盖0-5460;
节点B覆盖5461-10922;
节点C覆盖10923-16383.
获取数据:
如果存入一个值,按照redis cluster哈希槽的算法: CRC16('key')384 = 6782。 那么就会把这个key 的存储分配到 B 上了。同样,当我连接(A,B,C)任何一个节点想获取'key'这个key时,也会这样的算法,然后内部跳转到B节点上获取数据
新增一个主节点:
新增一个节点D,redis cluster的这种做法是从各个节点的前面各拿取一部分slot到D上,我会在接下来的实践中实验。大致就会变成这样:
节点A覆盖1365-5460
节点B覆盖6827-10922
节点C覆盖12288-16383
节点D覆盖0-1364,5461-6826,10923-12287
同样删除一个节点也是类似,移动完成后就可以删除这个节点了。
4) Redis Cluster主从模式
redis cluster 为了保证数据的高可用性,加入了主从模式,一个主节点对应一个或多个从节点,主节点提供数据存取,从节点则是从主节点拉取数据备份,当这个主节点挂掉后,就会有这个从节点选取一个来充当主节点,从而保证集群不会挂掉。
上面那个例子里, 集群有ABC三个主节点, 如果这3个节点都没有加入从节点,如果B挂掉了,我们就无法访问整个集群了。A和C的slot也无法访问。
所以我们在集群建立的时候,一定要为每个主节点都添加了从节点, 比如像这样, 集群包含主节点A、B、C, 以及从节点A1、B1、C1, 那么即使B挂掉系统也可以继续正确工作。
B1节点替代了B节点,所以Redis集群将会选择B1节点作为新的主节点,集群将会继续正确地提供服务。 当B重新开启后,它就会变成B1的从节点。
不过需要注意,如果节点B和B1同时挂了,Redis集群就无法继续正确地提供服务了。
二、redis cluster安装
1、分别在node-1、node-2、node-3、node-4、node-5、node-6下载和解压
cd /usr/local/src
wget http://download.redis.io/releases/redis-3.2.6.tar.gz
tar -zxvf /redis-3.2.6.tar.gz
2、 编译安装
cd redis-3.2.6
make && make install PREFIX=/usr/local/redis-cluster
3、创建redis节点
生产环境我们选择6台服务器,分别为:
node1:192.168.100.200
node2:192.168.100.201
node3:192.168.100.202
node4:192.168.100.203
node-5:192.168.100.204
node-6:192.168.100.205,每台服务器1个节点。
先在node-1:192.168.100.200创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-1.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //超时
appendonly yes //开启aof日志
在剩下的5台物理机上同样执行上述配置
node-2:192.168.100.201创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-2.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //超时
appendonly yes //开启aof日志
node-3:192.168.100.202创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-3.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //超时
appendonly yes //开启aof日志
node-4:192.168.100.203创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-4.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //请求超时,把注释#去掉,设置5秒
appendonly yes //开启aof日志,每次写操作都记录一条日志
node5:192.168.100.204创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-5.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //超时
appendonly yes //开启aof日志
node-6:192.168.100.205创建1个节点:
/usr/local/src/redis-3.2.6/redis.conf
修改node-6.conf 对应的配置
daemonize yes
protected-mode no
cluster-enabled yes cluster-config-file nodes-6379.conf
cluster-node-timeout 5000 //超时
appendonly yes //开启aof日志
4、分别启动六台物理机上各节点
cd /usr/local/redis-cluster
./redis-server /etc/redis-cluster/node-1.conf
./redis-server /etc/redis-cluster/node-1.conf
./redis-server /etc/redis-cluster/node-1.conf
./redis-server /etc/redis-cluster/node-1.conf
./redis-server /etc/redis-cluster/node-1.conf
./redis-server /etc/redis-cluster/node-6.conf
5、查看服务
ps -ef | grep redis #查看是否启动成功
netstat -tunlp | grep redis #可以看到redis监听端口
三、创建集群
1.安装ruby
yum -y install ruby ruby-devel rubygems rpm-build
2.安装redis接口(用gem 这个命令安装redis接口,gem是ruby的一个工具包,
当然,为了日后方便维护,六台Server都要安装。)
gem install redis
3.创建集群
确认所有的节点都启动后,使用如下命令创建集群
/usr/local/redis-3.2.6/src/redis-trib.rb create --replicas 1 192.168.100.200:6379 192.168.100.201:6379 192.168.100.202:6379 192.168.100.203:6379 192.168.100.204:6379 192.168.100.205:6379
其中 --replicas 1 表示 自动为每一个master节点分配一个slave节点 上面有6个节点,程序会按照一定规则生成 3个master(主)3个slave(从)
4.查看集群中的节点:
192.168.100.200:6379> cluster nodes
5.停止redis cluster实例:
停止redis实例,直接使用kill命令即可,重启和单机版相同,重启会自动转换成cluster模式。
四、测试
1)查看集群中的节点
redis-cli -h 192.168.100.200 -c -p 6379
cluster nodes
2)存取测试
redis-cli -h 192.168.100.200 -c -p 6379
set aa aa
3) 新增节点
1.添加一个新主(master)节点,按上述操作配置好单机版redis并启动,然后执行命令:
./redis-trib.rb add-node 192.168.100.206:6379 192.168.100.200:6379
其中192.168.100.206:6379是新增的节点,而192.168.100.200:6379是已存在的节点(可为master或slave)。
2.指定添加某master的新从(slave)节点,按上述操作配置好单机版redis并启动,然后执行命令:
./redis-trib.rb add-node --slave --master-id 3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e192.168.100.207:6379192.168.100.206:6379
其中192.168.100.207:6379是新增的slave节点,而192.168.100.206:6379是已存在的master节点,3c3a0c74aae0b56170ccb03a76b60cfe7dc1912e 是192.168.100.206:6379的master-id。
3)容错测试
Down掉1台master,集群OK, Down掉2台master,cluster is down!! 没办法,超过半数master挂掉,整个集群就无法工作了。
五、安装遇到的问题
1、
CC adlist.o
/bin/sh: cc: command not found
make[1]: *** [adlist.o] Error 127
make[1]: Leaving directory `/usr/local/redis-3.2.6/src
make: *** [all] Error 2
解决办法:GCC没有安装或版本不对,安装一下
yum install gcc -y
2、
zmalloc.h:50:31:
error: jemalloc/jemalloc.h: No such file or directory
zmalloc.h:55:2: error:
#error "Newer version of jemalloc required"
make[1]: *** [adlist.o] Error
1
make[1]: Leaving directory `/data0/src/redis-2.6.2/src
make: *** [all]
Error 2
解决办法:原因是没有安装jemalloc内存分配器,可以安装jemalloc 或 直接
make MALLOC=libc && make install PREFIX=/usr/local/redis-cluste