Redis解决单个hashkey的value过大与pipeline使用

需求

公司目前缓存用户定位信息采用Redis,数据结构采用Hash。随着用户人数增多,单个hashkey的value越来越大,达到200M,严重影响了Redis 的性能。储存用户的hash结构如下。


redis里的hash结构.png

处理思路

根据field生成新的hashkey

$keyNum =  (int) floor($uid/100000);
$newRedisKey = 'user_location_'  .  $keyNum;
$res = $redis->hset($newRedisKey, $uid, $location);

然后将单个hashkey里的数组全部循环一遍,根据uid生成的新key去存储。

处理过程中遇到的问题:

1,获取所有数据的方法KEYS 、 HGETALL 等命令应禁止在生产环境使用。看官方文档,有非常显眼的警告。
2,单条处理产生新的key存储1320000数据,由于redis是单线程的,下一次请求必须等待上一次请求执行完成后才能继续执行。这种方式非常依赖网络,非常耗时。经测试,120万数据,网络良好情况下执行需要3个小时。

针对问题一的解决方法

使用hashscan方法获取单个hashkey的所有数据,
优势:相比于keys命令,hscan命令有两个比较明显的优势:
1.scan命令的时间复杂度虽然也是O(N),但它是分次进行的,不会阻塞线程。
2.scan命令提供了limit参数,可以控制每次返回结果的最大条数。
3.SCAN命令是增量的循环,每次调用只会返回一小部分的元素。所以不会有KEYS命令的坑。
4.SCAN命令返回的是一个游标,从0开始遍历,到0结束遍历。

代码如下

$itertor = NULL;
$allUserLocation = $redis->hScan('user_location', $itertor, '*', 10000000);

参数解释
1.user_location为hashkey值
2.itertor为迭代器,起始位置游标
3.pattern 匹配某一种field
4.单次遍历返回个数

针对问题二的解决方法

采用pipeline
优势:Pipeline模式,客户端可以一次性的发送多个命令,无需等待服务端返回。这样就大大的减少了网络往返时间,提高了系统性能。
缺点:不能保证数据完整性
所以需要开启事务multi

$pipe = $redis->multi($redis::PIPELINE);
$keyNum =  (int) floor($uid/100000);
$newRedisKey = 'user_location_' . $keyNum;
try {
            $res = $pipe->hset($newRedisKey, $uid, $location);
    } catch (Exception $e) {
            echo $e->getMessage();
    }
            unset($arrayAllUser[$uid]);
    }
            $result = $pipe->exec();

multi和pipeline的区别
multi相当于一个redis的transaction的,保证整个操作的原子性,避免由于中途出错而导致最后产生的数据不一致。通过测试得知,pipeline方式执行效率要比其他方式高10倍左右的速度,启用multi写入要比没有开启慢一点。

本以为处理到这里就结束了

大坑

pipeline事实上所能容忍的操作个数,和socket-output缓冲区大小/返回结果的数据尺寸都有很大的关系;同时也意味着每个redis-server同时所能支撑的pipeline链接的个数,也是有限的,这将受限于server的物理内存或网络接口的缓冲能力。
处理到117万条数据时 会报错数据无法落地,rdb无法使用;
处理方法
1:命令

    dev:0> config set stop-writes-on-bgsave-error no

2:vi打开redis-server配置的redis.conf文件,然后使用快捷匹配模式:/ stop-writes-on-bgsave-error定位到stop-writes-on-bgsave-error字符串所在位置,接着把后面的yes设置为no即可。然后重启。
3:数据再分批次处理。
我选用第三种方法,每次只处理50万条。

5分钟执行完毕。

完成任务。

参考文档:Redis中scan命令的深入讲解 https://www.jb51.net/article/148698.htm
redis中multi和pipeline区别以及效率(推荐使用pipeline)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,047评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,807评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,501评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,839评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,951评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,117评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,188评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,929评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,372评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,679评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,837评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,536评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,168评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,886评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,129评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,665评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,739评论 2 351

推荐阅读更多精彩内容