redis4 集群

配置redis实例 并启动

一般使用三台服务器, 每台服务器上启动两个实例,互为主备。

  1. 下载redis4.0.9 源码, 编译
  2. 每台服务器上配置两个实例,根据端口后区分
mkdir -p 7001 
mkdir -p 7002 

在7001 7002目录下拷贝并编辑配置文件redis.conf 。

cluster-enabled yes
bind 10.30.16.202
cluster-config-file nodes-7001.conf
cluster-node-timeout 5000
appendonly yes

  1. 启动实例:
./src/redis-server 7001/redis.conf > redis-server-7001.out 2>&1 &

日志文件为 redis-server-7001.out 。

下面是启动实例后的日志信息, 根据日志有些参数需要调整,如下:

88841:C 09 Jun 15:59:11.598 # oO0OoO0OoO0Oo Redis is starting oO0OoO0OoO0Oo
88841:C 09 Jun 15:59:11.599 # Redis version=4.0.9, bits=64, commit=00000000, modified=0, pid=88841, just started
88841:C 09 Jun 15:59:11.599 # Configuration loaded
88841:M 09 Jun 15:59:11.600 * No cluster configuration found, I'm 81801de023462c4b4096cf374350adb5b7100e84
88841:M 09 Jun 15:59:11.604 * Running mode=cluster, port=7002.
88841:M 09 Jun 15:59:11.604 # WARNING: The TCP backlog setting of 511 cannot be enforced because /proc/sys/net/core/somaxconn is set to the lower value of 128.
88841:M 09 Jun 15:59:11.604 # Server initialized
88841:M 09 Jun 15:59:11.604 # WARNING overcommit_memory is set to 0! Background save may fail under low memory condition. To fix this issue add 'vm.overcommit_memory = 1' to /etc/sysctl.conf and then reboot or run the command 'sysctl vm.overcommit_memory=1' for this to take effect.
88841:M 09 Jun 15:59:11.604 # WARNING you have Transparent Huge Pages (THP) support enabled in your kernel. This will create latency and memory usage issues with Redis. To fix this issue run the command 'echo never > /sys/kernel/mm/transparent_hugepage/enabled' as root, and add it to your /etc/rc.local in order to retain the setting after a reboot. Redis must be restarted after THP is disabled.
88841:M 09 Jun 15:59:11.604 * Ready to accept connections

  • 参数 /proc/sys/net/core/somaxconn
    临时修改: echo 511 > /proc/sys/net/core/somaxconn
    永久修改: 在 /etc/sysctl.conf ,添加
# for redis cluster tcp backlog warning 
net.core.somaxconn = 1024
  • 参数 vm.overcommit_memory :
    进程通常调用malloc()函数来分配内存,内存决定是否有足够的可用内存,并允许或拒绝内存分配的请求。Linux支持超量分配内存,以允许分配比可用RAM加上交换内存的请求。
    vm.overcommit_memory参数有三种可能的配置:

0 表示检查是否有足够的内存可用,如果是,允许分配;如果内存不够,拒绝该请求,并返回一个错误给应用程序。
1 表示根据vm.overcommit_ratio定义的值,允许分配超出物理内存加上交换内存的请求。vm.overcommit_ratio参数是一个百分比,加上内存量决定内存可以超量分配多少内存。
例如,vm.overcommit_ratio值为50,而内存有1GB,那么这意味着在内存分配请求失败前,加上交换内存,内存将允许高达1.5GB的内存分配请求。
2 表示内核总是返回true。
除了以上几个常见的Linux内核调优方法外,还有一些其他的方法,管理员可根据需要进行适当调整。

在hadoop中 , 要求此项设置为0 ; 在redis中要求此项设置为1.

  • 参数 'echo never > /sys/kernel/mm/transparent_hugepage/enabled' , 默认总是启用透明大页面,需要关闭;

在启动了六个实例后, 后续是将这些实例组织为集群:

#脚本 starCluster.sh
./src/redis-trib.rb create --replicas 1 10.30.16.202:7000 10.30.16.202:7001 10.30.16.203:7002 10.30.16.203:7003 10.30.16.204:7004 10.30.16.204:7005

其中 参数 --replicas 1 表示后续的列表中每个master跟一个salve。
(若机器上没有ruby环境, 会报错,见另一篇ruby安装。)

启动集群:

[root@node202 redis-4.0.9]# ./startCluster.sh 
>>> Creating cluster
>>> Performing hash slots allocation on 6 nodes...
Using 3 masters:
10.30.16.202:7000
10.30.16.203:7002
10.30.16.204:7004
Adding replica 10.30.16.203:7003 to 10.30.16.202:7000
Adding replica 10.30.16.204:7005 to 10.30.16.203:7002
Adding replica 10.30.16.202:7001 to 10.30.16.204:7004
M: e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000
   slots:0-5460 (5461 slots) master
S: e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001
   replicates d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60
M: 81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002
   slots:5461-10922 (5462 slots) master
S: efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003
   replicates e5e7bb21b75c5fd222cf8a6eb99ef19606480c99
M: d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004
   slots:10923-16383 (5461 slots) master
S: 8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005
   replicates 81801de023462c4b4096cf374350adb5b7100e84
Can I set the above configuration? (type 'yes' to accept): yes
>>> Nodes configuration updated
>>> Assign a different config epoch to each node
>>> Sending CLUSTER MEET messages to join the cluster
Waiting for the cluster to join...
>>> Performing Cluster Check (using node 10.30.16.202:7000)
M: e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000
   slots:0-5460 (5461 slots) master
   1 additional replica(s)
S: 8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005
   slots: (0 slots) slave
   replicates 81801de023462c4b4096cf374350adb5b7100e84
S: e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001
   slots: (0 slots) slave
   replicates d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60
S: efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003
   slots: (0 slots) slave
   replicates e5e7bb21b75c5fd222cf8a6eb99ef19606480c99
M: d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004
   slots:10923-16383 (5461 slots) master
   1 additional replica(s)
M: 81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002
   slots:5461-10922 (5462 slots) master
   1 additional replica(s)
[OK] All nodes agree about slots configuration.
>>> Check for open slots...
>>> Check slots coverage...
[OK] All 16384 slots covered.

验证

redis-cli -h hostname -c -p 端口
-h 表示连接的主机ip或域名;
-p 表示端口
-c 表示连接到集群

[root@node202 src]# ./redis-cli -h 10.30.16.202 -c -p 7001
10.30.16.202:7001> show
(error) ERR unknown command 'show'
10.30.16.202:7001> set hello world
-> Redirected to slot [866] located at 10.30.16.202:7000
OK
10.30.16.202:7000> get hello
"world"
10.30.16.202:7000> keys
(error) ERR wrong number of arguments for 'keys' command
10.30.16.202:7000> KEYS *
1) "hello"
10.30.16.202:7000> set zzz 123
-> Redirected to slot [10118] located at 10.30.16.203:7002
OK
10.30.16.203:7002> keys *
1) "zzz"
10.30.16.203:7002> KEYS *
1) "zzz"
10.30.16.203:7002> get hello
-> Redirected to slot [866] located at 10.30.16.202:7000
"world"
10.30.16.202:7000> 

可以看到, 虽然连接的是7001端口(备), 但是在真正使用时会自动跳转到相应的机器和端口上。

Redis 集群没有并使用传统的一致性哈希来分配数据,而是采用另外一种叫做哈希槽 (hash slot)的方式来分配的。redis cluster 默认分配了 16384 个slot,当我们set一个key 时,会用CRC16算法来取模得到所属的slot,然后将这个key 分到哈希槽区间的节点上,具体算法就是:CRC16(key) % 16384。所以我们在测试的时候看到set 和 get 的时候,直接跳转到了不同端口的节点。

Redis 集群会把数据存在一个 master 节点,然后在这个 master 和其对应的salve 之间进行数据同步。当读取数据时,也根据一致性哈希算法到对应的 master 节点获取数据。只有当一个master 挂掉之后,才会启动一个对应的 salve 节点,充当 master 。

需要注意的是:必须要3个或以上的主节点,否则在创建集群时会失败,并且当存活的主节点数小于总节点数的一半时,整个集群就无法提供服务了。

集群状态命令

cluster info : 显示集群的信息
cluster nodes: 显示集群的节点信息

10.30.16.202:7000> cluster info
cluster_state:ok
cluster_slots_assigned:16384
cluster_slots_ok:16384
cluster_slots_pfail:0
cluster_slots_fail:0
cluster_known_nodes:6
cluster_size:3
cluster_current_epoch:6
cluster_my_epoch:1
cluster_stats_messages_ping_sent:3619
cluster_stats_messages_pong_sent:3653
cluster_stats_messages_sent:7272
cluster_stats_messages_ping_received:3648
cluster_stats_messages_pong_received:3619
cluster_stats_messages_meet_received:5
cluster_stats_messages_received:7272
10.30.16.202:7000> cluster nodes
8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005@17005 slave 81801de023462c4b4096cf374350adb5b7100e84 0 1528539083570 6 connected
e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001@17001 slave d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 0 1528539084570 5 connected
efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003@17003 slave e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 0 1528539084570 4 connected
d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004@17004 master - 0 1528539083000 5 connected 10923-16383
e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000@17000 myself,master - 0 1528539084000 1 connected 0-5460
81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002@17002 master - 0 1528539083570 3 connected 5461-10922

故障转移

  • 对master 或slaver 使用 DEBUG SEGFAULT
    使用该命令后, 相应端口的实例进程会被杀掉。 即通过ps-ef | grep redis 查看不到相应的进程。
10.30.16.202:7000> DEBUG SEGFAULT
Could not connect to Redis at 10.30.16.202:7000: Connection refused
not connected> 
not connected> 
not connected> exit
[root@node202 src]# ./redis-cli -h 10.30.16.202 -c -p 7001
10.30.16.202:7001> cluster nodes
81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002@17002 master - 0 1528539342049 3 connected 5461-10922
e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000@17000 master,fail - 1528539328099 1528539325593 1 disconnected
d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004@17004 master - 0 1528539342049 5 connected 10923-16383
8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005@17005 slave 81801de023462c4b4096cf374350adb5b7100e84 0 1528539341548 6 connected
efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003@17003 master - 0 1528539342551 7 connected 0-5460
e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001@17001 myself,slave d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 0 1528539341000 2 connected

(从DEBUG SEGFAULT 恢复 ,需要重启该实例!)

[root@node202 redis-4.0.9]# ./src/redis-cli -h 10.30.16.202 -c -p 7000
10.30.16.202:7000> cluster nodes
e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000@17000 myself,slave efef338ae359169cbc88348dc992155471932797 0 1528539832000 1 connected
efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003@17003 master - 0 1528539831268 7 connected 0-5460
8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005@17005 slave 81801de023462c4b4096cf374350adb5b7100e84 0 1528539832000 6 connected
e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001@17001 master - 0 1528539832571 8 connected 10923-16383
d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004@17004 slave e8c848eca117a91e7166f35abdea3012cda35bbe 0 1528539832270 8 connected
81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002@17002 master - 0 1528539831268 3 connected 5461-10922

重启后, 可以看到7001变为master , 7000为slave 。

  • 对slaver使用 CLUSTER FAILOVER 命令
    该命令只能对slave使用, 是将salve提升为master 。
10.30.16.202:7001> CLUSTER FAILOVER
OK
10.30.16.202:7001> 
10.30.16.202:7001> 
10.30.16.202:7001> cluster nodes
81801de023462c4b4096cf374350adb5b7100e84 10.30.16.203:7002@17002 master - 0 1528539628000 3 connected 5461-10922
e5e7bb21b75c5fd222cf8a6eb99ef19606480c99 10.30.16.202:7000@17000 master,fail - 1528539328099 1528539325593 1 disconnected
d2b2e76cdc4e7ec41b7a0002d43cbe80127f3a60 10.30.16.204:7004@17004 slave e8c848eca117a91e7166f35abdea3012cda35bbe 0 1528539628959 8 connected
8752f40fe95cb4cd65e43a76208a883ed50bba6f 10.30.16.204:7005@17005 slave 81801de023462c4b4096cf374350adb5b7100e84 0 1528539627555 6 connected
efef338ae359169cbc88348dc992155471932797 10.30.16.203:7003@17003 master - 0 1528539628557 7 connected 0-5460
e8c848eca117a91e7166f35abdea3012cda35bbe 10.30.16.202:7001@17001 myself,master - 0 1528539628000 8 connected 10923-16383

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353

推荐阅读更多精彩内容

  • 背景说明: 项目初期使用AWS的ElastiCacheRedis作为系统的数据缓存,近期由于数据量和QPS加大...
    Jacen7阅读 1,760评论 0 1
  • NOSQL类型简介键值对:会使用到一个哈希表,表中有一个特定的键和一个指针指向特定的数据,如redis,volde...
    MicoCube阅读 3,980评论 2 27
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,652评论 18 139
  • Redis3.2.9/4.0.1集群部署配置优化 参考文档 http://www.redis.cn/topics/...
    三杯水Plus阅读 890评论 0 3
  • 中国人信奉的“在家靠父母,出门靠朋友”的理念,就是这类思维的外在延续。人们也会以接受他人的救济为耻,但这救济如果来...
    大诚小乐阅读 536评论 0 0