先更新数据库，还是缓存？

这一篇来聊聊缓存一致性的问题，这里讨论的范围有限，仅仅是应用缓存与后端存储的一致性，当然也会适当做下延伸

1. Cache Aside，更通用的选择

如下 4 种组合，该如何决策？标准在哪里？一致性问题出在哪？

从根本上讲，我们维护着两个数据源，两个数据源之间的一致性你得实时关照，这其实是一个分布式事务问题，既然是事务，就得老生常谈 ACID 了，持久性由 DB 和 Cache 存储机制保证，一致性作为原子性和隔离性的结果，我们主要要从这两个维度去衡量我们的方案是否可行

多线程同时操作临界资源，需要保证符合调用时序，不能乱，否则就会相互干扰造成逻辑错误

当隔离性不能保障我们看看会出现什么问题:

image

不难看出，DB 的操作时序性保证需要将 DB 操作放在第一步
而如果选择 update 而不是 delete 操作缓存，那缓存的操作也需要放在第一步，由此可见，为了保证逻辑自洽，update db + delete cache 是最佳选择

同时成功，同时失败
保障方案：
a. 尽量不要存在中间状态，调用失败需要同步反馈调用方重新发起调用
b. 做补偿删除，如更新数据库失败则删除已更新的缓存

原子性这一块，当我们不引入其他原子性保护机制的时候，不能保证强一致性，对于以上所有选型都是差不多的，不能起到决策作用

综上，update db + delete cache 是我们更加通用的选择，简单点叫 Cache Aside

作为数据源的调用方同时也是一致性的管理者，我们全知全能，上层使用者需要关心一致性的保障细节，同时有了代码耦合，编程模型被要求先 update db + delete cache，复杂度扩散在每一个使用 cache aside 策略的地方

其实缓存这个通用问题也可以有另外一种思路：抽象缓存组件，缓存一致性由缓存组件来保证，对调用者屏蔽掉缓存一致性的细节，调用者只需要跟缓存组件交互即可

image

这种方式的缺点就是引入了缓存组件，依赖缓存组件的高性能，但是缓存组件还可以做很多事情，比如过期回调，逐出等。另外业界也有产品可以参考：腾讯云Redis 混合存储版

image

存储并非每次访问都写，而是引入脏页的概念，当缓存第一次被访问，只会做脏页标记，当缓存再次命中，需要做替换更新，才将老数据做刷新

write miss 的同时，加载 back-store 中的数据到 cache，然后走 write hit 的流程。这种方式更契合 Write Back

write miss 的同时，直接写 back-store。这种方式更契合 Write Through

最后编辑于：2020.10.06 18:23:46

禁止转载，如需转载请通过简信或评论联系作者。