我们在一个比较大型的,流量和用户都比较大项目中使用缓存,或者设计缓存系统时,不得不要考虑的问题就是:缓存穿透、缓存击穿、缓存失效时的雪崩效应。
我们一般的流程都是这样的:前台请求,后台先从缓存中取数据,如果取到数据就直接返回结果,取不到时就从数据库中取,从数据库中取到更新缓存,并返回结果,数据库也取不到,那就直接返回空结果。
1、缓存穿透
描述:
缓存穿透是指缓存和数据中都没有数据,而用户不断发起请求。由于我们缓存逻辑一般都是不命中时被动写的,并且出于容错考虑,如果从数据库查不到数据库就不写缓存直接返回,这将导致整个不存在的数据每次都要到数据库去查询,这样缓存就失去意义了。
在流量大时,可能数据库就会挂掉了,要是有人利用不存在的key频繁攻击我们的应用,这就形成一个漏洞了。如发起id为小于0的数据或者id为特别大不存在的数据,这时的用户很可能是攻击者,攻击会导致数据库压力过大。
针对上面情况的解决方案
- 最基本的接口层增加校验,比如用户鉴权,一些ID做基础的校验,小于0或者大于某个范围的值直接拦截
-从缓存取不到数据,在数据库中也没有取到时,将该缓存key的值设为null,缓存的有效时间可以设置短一点,10秒,20秒(不宜过大,过大可能会导致正常情况也没法使用)。这样可以防止攻击用户反复攻击同一个数据。
缓存击穿
描述
缓存击穿是指缓存中没有但数据库中有的数据(一般是缓存时间到期),这时由于并发用户特别多,同时读缓存没读到数据库,又同时去数据库去取数据,引起数据库压力瞬间增大,造成DB过大的压力。
解决方案:
-一些热点数据设置永远不过期
-接口限流与熔断和降级。重要的接口一定要做好限流策略,防止用户恶意刷接口,同时要降级准备,当接口中的某些服务不可用时,进行熔断,失败快速返回机制。
-布隆过滤器。bloomfilter就类似于一个hash set,用于快速判断某个元素是否存在于集合中,其典型的应用场景就是快速判断一个key是否存在,不存在就直接返回。布隆过滤器的关键就在于hash算法和容器大小。
-加互斥锁 参考代码如下
public function getCachedData($key)
{
$rs = Redis::get($key);
if (empty($rs)) {
$lock = 'list_lock_key';
$lockResult = Redis::setnx($lock, true);
if ($lockResult) {
Redis::set($lock, true, 30);
$rs = mysqlGetDate();
Redis::delete($lock);
}
if (!$lockResult) {
usleep(100);
$rs = $this->getCachedData($key);
}
}
return $rs;
}
//缓存中没有数据,第1个进入的线程,获取锁并从数据库去取数据,没释放锁之前,其他并行进入的线程会等待100ms,再重新去缓存取数据。这样就防止都去数据库重复取数据,重复往缓存中更新数据情况出现
细心的朋友可能已经发现上面代码加锁是有问题的。问题出在:假如我们获取锁成功后,程序突然崩溃了,那锁不就是没有释放,后面的所有获取锁的请求都等待了。那就是出大问题了。为了避免出现这样问题,我们来把代码逻辑修改下
/**
进程1获得锁后操作超时/崩溃/删除锁失败,
进程2检测到锁已存在,但获取锁的值对比当前时间发现锁已过期,
进程2通过GETSET命令重新给锁赋予新的值,并获取到的锁的旧值,再次对比锁的旧值与当前时间,如果锁的旧值依然小于当前时间的话,这时进程2就可以忽略进程1余留下的废锁进行下步操作了
进程2完成下步操作后返回前应该删除锁,但在删除锁时可以先检测锁是否还未过期,未过期才做删除操作,已过期的就没必要在去删除锁了,因为很有可能其他进程检测到锁过期时已经去获取锁了
这里要重点说明的是,如果有其他进程在进程2之前获取到锁,那么进程2将获取锁失败,但是进程2在用GETSET获取锁的旧值时也赋予了锁新的值,改写了其他进程赋予锁的超时值。
看到这大家可能会有疑问了,进程2没获取到锁怎么能改变锁的值呢?是的,进程2改变了锁的原有值,但这一点小小的时间误差带来的影响是可以忽略。
毕竟没有完美的解决方案,时间换空间或者空间时间同理
**/
public function getCachedData($key)
{
$rs = Redis::get($key);
if (empty($rs)) {
$time = time();
$lockExpire = 20;//锁的过期时间
$lockValue = $time + $lockExpire;//锁的值
$lock = 'list:'.$key;
$lockResult = Redis::setnx($lock, $lockValue);
if ($lockResult || Redis::get($lock)< $time || Redis::getset($lock, $lockValue) < $time) {
Redis::expire($lock, $lockExpire);
$rs = mysqlGetDate();
//过期的锁不用删除
if(Redis::ttl($lock))
Redis::delete($lock);
}
if (!$lockResult) {
usleep(100);
$rs = $this->getCachedData($key);
}
}
return $rs;
}
//
缓存雪崩
描述
缓存雪崩是指缓存中数据大批量到过期时间,而且查询数据量巨大,引起的数据库压力过大甚至宕机。和缓存击穿不同的是,缓存击穿是指并发查同一条数据,缓存雪崩是不同数据都过期了,很多数据都从数据库查。
解决方案
-缓存数据的过期时间设置随机,防止同一时间大量数据过期现象发生。
-如果缓存数据库是分布式部署,将热点数据均匀分布在不同的缓存数据库中
-设置热点数据不过期