设计一个缓存系统需要考虑:缓存穿透,缓存击穿、失效时得雪崩效应。
缓存穿透:缓存穿透是指查询一个一定不存在数据,由于缓存是不命中时被动写的,并且处于容错考虑,如果从存储层查不到数据则不写入缓存,这将导致这个不存在得数据每次请求都要从存储层去查询,失去了缓存得意义。在流量大时,可能DB就挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就是漏洞。
解决方案:
布隆过滤器:将所有可能存在的数据哈希到一个足够大的bitmap中,一个一个不存在的数据会被bitmap拦截掉,从而避免了对底层存储系统的压力。
如果一个查询返回的数据为空(不管系统故障还是数据不存在),我们仍把这个空结果缓存,但它的过期时间会很短,最长不超过5分钟。
缓存雪崩:指在我们设置了缓存时采用了相同的过期时间,导致缓存在某一时刻同时失效,请求全部转发到DB,DB瞬时压力过重雪崩。
解决方案:
缓存失效时的雪崩效应对底层系统的冲击非常可怕。大多数系统设计者考虑加锁或者队列的方式保证缓存单线程(进程)写从而避免失效时大量的并发请求落到底层存储系统上 。分享一个简单的方案将缓存失效时间分散开,比如我们可以在原有的失效时间基础上增加一个随机值,比如1-5分钟随机,这样每一个缓存的过期时间重复率降低,就不容易引发集体失效事件。
缓存击穿:对于一些设置了过期时间的key,如果这些key 可能会在某些时间点被超高并发的访问,是一种非常“热点”的数据。这个时候需要考虑一个问题:缓存被击穿的问题,这个和缓存雪崩的区别在于,这里是针对某一key缓存,前者则是很多key.
缓存在某个时间点过期的时候,恰好在这个时间点对这个key有大量的并发请求过来,这些请求发现缓存过期一般会从后端DB加载数据并回设到缓存,这个时候大并发的请求可能会瞬间把DB压垮。
解决方案:
1、使用互斥锁(mutex key)
简单来说,就是在缓存失效的时候(判断拿出来的值为空),不是立即去load db ,而是先使用缓存工具的某些带成功操作返回值的操作(比如Redis的SETNX或者Memcache的ADD)去set一个mutex key,当操作返回成功时,再进行 load db 的操作并回设缓存;否则,就重试整个get缓存方法。
SETNX,是 set if not exists 的缩写,也就是不存在的时候才设置,可以利用它来实现锁的效果。在 redis2.6.1之前的版本还未实现setnx 的过期时间,所以这里给出两种版本代码参考:
//2.6.1.前单机版本锁
String get(String key){
String value=redis.get(key);
if (value==null){
if(redis.setnx(key_mutex,1)){
//3 min timeout to avoid mutex holder crash
redis.expire(key_mutex,3*60);
value = db.get(key);
redis.set(key,value);
redis.delete(key_mutex);
}else{
//其他线程休息50毫秒重试
Thread.sleep(50);
get(key);
}
}
}
//新版本代码
public String get(key){
String value=redis.get(key);
if (value==null){
if (redis.setnx(key_mutex,1,3*60)==1){
value=db.get(key);
redis.set(key,value,expire_secx);
redis.del(key_mutex);
}else{
sleep(50);
get(key);
}else{
return value;
}
}
2,"提前“使用互斥锁(mutex key)
在value内部设置一个超时值(timeout1),timeout1比实际的memcache timeout(timeout2)小。当从cache读取到timeout1发现已经过期时,马上延长 timeout1并重新设置到cache.然后再从数据库中加载数据并加载到cache中。
伪代码如下:
3、“永远不过期”
这里的“永远不过期”包含两层含义:
(1)从redis上看,确实没有设置过期时间,这就保证了,不会出现热点key过期问题,也就是“物理”的不过期
(2)从功能上看如果不过期,那不就成静态的了么?所以我们把过期时间存在key对应的value里,如果发现要过期了,通过一个后台的异步线程进行缓存构建,也就是“逻辑”过期
从实战看,这种方法对于性能非常友好,唯一不足的就是构建缓存的时候,其余线程(非构建缓存的线程)可能访问的时老数据,但是对于一般的互联网功能来说这个还是可以忍受。
4、资源保护
采用netflix的hystrix,可以做资源的隔离保护主线程池,如果把这个应用到缓存的构建也是可以的。
四种解决方案没有最佳只有最合适
总结:
针对业务系统,永远都是具体情况具体分析没有最好只有最合适。
最后,对于缓存系统常见的缓存满了和数据丢失问题,需要根据具体业务分析,通常我们采用LRU策咯处理溢出,Redis的RDB和AOF持久化策咯来保证一定情况的数据安全。
标注:内容来源于网络公众号等,非本人原创 ~ ~。