从一个数据存储按需加载数据到一个缓存中。该模式能够提高性能并且也有助于维护缓存中的数据和底层数据存储中的数据之间的一致性。
场景
应用程序使用某个缓存来改进重复访问数据存储的信息的过程。然而,期望缓存的数据总是会和数据存储中的数据完全一致是不切合实际的。应用程序应该采取某种策略来帮助确保缓存中的数据尽可能是最新的,但是也能够发现和处理当缓存中的数据变的过时(失效)的情况。
解决方案
很多商业缓存系统提供穿透读(read-through)和穿透写(write-through)/延迟写(write-behind)等操作。在这些系统中,应用程序通过引用缓存来检索数据。如果数据不在缓存中,它从数据存储中检索并且将数据加入到缓存中去。同样地,任何对于缓存中的数据的修改都会自动地回写到数据存储中。
应用程序能够,通过采取预留缓存(cache-aside)策略,模仿穿透读缓存(read-through caching)的功能。该策略按需加载数据到缓存中。下图展示了使用预留缓存模式在缓存中存储数据:
如果应用程序更新信息,可以通过修改数据存储以及使缓存中相关数据失效来遵循写穿透(write-through)策略。
当该数据项紧接着被需要时,使用预留缓存(cache-aside)策略会导致从数据存储中检索已更新的数据并且添加回缓存中。
考虑点
缓存数据的生命周期。很多缓存实现了某种过期策略,如果数据在特定时间段没有被访问,那么缓存会使这些数据失效并且从缓存中移除这些数据。为了高效化预留缓存,确保过期策略匹配应用程序访问数据的模式。不要让过期时间太短,因为这样会导致应用程序持续不断地从数据存储中检索数据并且添加数据到缓存中。同样地,不能让过期时间太长以至于缓存的数据可能失效了。需要注意的是缓存对于相对静态的数据或频繁读取的数据最有效率。
缓存数据的清除。大多数缓存相对于数据存储都有固定的大小,并且如果必要,它们会清除数据。大多数缓存采用一种最近最少使用策略来选取清除的数据项,但是该策略也是能够配置的。配置全局过期属性和其它的缓存属性,以及每个缓存项的过期属性,来确保缓存是成本有效的。在缓存中,针对每个项应用某种全局清除策略不总是合适的。例如,如果某个缓存项从数据存储中检索出来代价很大,以牺牲那些频繁访问但检索成本低的数据项来保持该缓存项在缓存中是有好处的。
缓存数据的准备。很多解决方案在程序启动时,用应用程序可能需要的数据预填充缓存。如果其中某些数据过期了或被移除了,预留缓存模式也能够很有用,
一致性。采用预留缓存模式不能保证数据存储和缓存之间的一致性。数据存储中某个数据项可以在任何时候被外部进程改变,并且该改变可能不会反映在缓存中,直到下一次加载该数据项。在多个数据存储之间复制数据的系统中,如果同步很频繁,该问题会变得很严重。
本地(内存中)缓存。对于应用程序实例来说,缓存可以是本地的并且存储在内存中。如果应用程序重复不断地访问相同的数据,在这种环境下预留缓存模式会很有用。然而,本地缓存是私有的,以至于不同的应用程序实例都会有相同缓存数据的副本。这些数据会很快的在缓存之间变得不一致,因此在私有缓存中频繁地过期和刷新数据是必要的。在这些场景下,考虑使用共享或分布式缓存机制。
什么时候使用?
适合:
缓存不提供原生的读穿透和写穿透操作。
资源的需求是不可预测的。该模式允许应用程序按需加载数据。不需要去假设应用程序会优先需要哪些数据。
不适合:
当缓存的数据集是静态的。如果数据可以刚好放入可用的缓存空间中,在启动的时候用这些数据来准备缓存,并且采用某个策略来防止这些数据失效。
对于在网络群中的web应用程序中缓存session状态信息。在该环境中,应该避免引入基于客户端-服务端连接关系的依赖。
文章来源:Cache-Aside pattern