缓存击穿、缓存穿透和缓存雪崩是分布式系统中常见的缓存问题,每个问题的原因和解决方法有所不同。下面是它们的定义以及如何解决这些问题:
1. 缓存击穿 (Cache Breakdown)
定义: 缓存击穿是指缓存中某个热点数据失效,并且该数据在短时间内频繁被访问,导致大量请求直接访问数据库,造成数据库压力剧增,甚至崩溃。
解决方案:
设置热点数据永不过期:对于一些热点数据,可以设置其缓存永不过期,但需要定期更新数据,以确保缓存数据的时效性。
-
加锁:对缓存失效的数据加锁,确保只有一个请求能访问数据库,其他请求等待缓存重新加载。可以使用分布式锁(如 Redis 的
SETNX
)来保证并发请求只会有一个访问数据库的线程。示例:
// Redis 锁的伪代码 if (redis.get("cacheKey") == null) { if (tryLock("cacheKey")) { // 只有一个请求能访问数据库 String data = fetchDataFromDB(); redis.set("cacheKey", data, 3600); releaseLock("cacheKey"); } else { // 等待其他线程加载数据 sleep(100); // 稍微等待 } }
互斥锁(Mutex):对于某个缓存失效的数据,多个请求竞争获取数据时,只让一个请求去查询数据库,其它请求等待该请求查询并缓存数据后再获取缓存。
2. 缓存穿透 (Cache Penetration)
定义: 缓存穿透是指请求的某些数据根本不存在(例如,查询数据库时返回 null
或空值),这类请求不会命中缓存,且每次请求都会去查询数据库,造成数据库负担过重。
解决方案:
-
缓存空对象:当查询结果为空时,缓存一个“空”值(如
null
或特定标记值),并设置一个较短的过期时间,防止恶意请求对数据库产生过大的压力。示例:
// 查询空值时缓存 if (data == null) { redis.set("cacheKey", null, 600); // 设置一个较短过期时间 }
-
布隆过滤器(Bloom Filter):通过布隆过滤器预先检查请求的数据是否存在,避免无效请求访问数据库。布隆过滤器能够以较小的空间开销判断某个数据是否存在,避免查询数据库时产生不必要的压力。
示例:
// 布隆过滤器检查请求 if (!bloomFilter.contains("cacheKey")) { return null; // 不存在的缓存,不请求数据库 }
3. 缓存雪崩 (Cache Avalanche)
定义: 缓存雪崩是指大量缓存同时失效,导致大量请求直接访问数据库,造成数据库瞬间承载大量压力,甚至崩溃。
解决方案:
-
缓存过期时间错峰:避免多个缓存的过期时间相同,可以对每个缓存设置不同的过期时间,使缓存不会在同一时间集中失效,平滑请求压力。
示例:
// 设置不同的过期时间,避免集中失效 redis.set("cacheKey", value, 3600 + Math.random() * 100);
-
使用双缓存策略:通过设置两个缓存的过期时间,使得当一个缓存失效时,另一个缓存仍然有效,减少数据库的访问压力。
示例:
// 双缓存策略 // 第一缓存过期时,检查第二缓存是否有效,第二缓存有效时直接返回
-
熔断机制:在出现缓存雪崩时,利用熔断机制来限制对数据库的访问,防止系统完全崩溃,可以通过限流、降级等方式处理。
示例:
// 熔断处理逻辑 if (cacheServerUnavailable()) { return fallbackData(); // 返回默认值或本地存储的数据 }
总结:
- 缓存击穿:通过加锁或互斥锁处理,避免缓存失效时,多个请求同时访问数据库。
- 缓存穿透:使用缓存空对象和布隆过滤器,避免无效请求频繁访问数据库。
- 缓存雪崩:通过设置不同的过期时间、使用双缓存和熔断机制等手段,防止大规模的缓存失效导致数据库崩溃。
解决这些问题的核心是合理设计缓存策略、使用分布式缓存的机制,并在高并发的情况下进行适当的限流、降级和容错处理。