PostgreSQL中的预取算法

关于Buffer

全部缓冲区构成一个缓冲池

缓冲池：

前面已经分析过：
数据库存储结构：元组-文件页-物理段-表
元组即一条记录，文件页（磁盘块）是存储和维护的最小单位

数据库访问对象的过程可以分为：从磁盘找找到这个对象所在的数据库（文件页）-把数据块（文件页）从磁盘读到内存-从内存访问数据。

在这个过程中，磁盘和内存的IO之间的操作是最耗时的，也是影响响应时间的主要因素。

对于单次请求，这个过程是顺序执行的。
但是对于多次并发请求，仍然顺序执行，结果就是：在对内存中的数据进行处理时，磁盘IO处于空闲；需要读取新的数据时，磁盘IO又称为影响响应时间的主要因素。

如果能在处理内存中的数据时，就预测要从磁盘请求数据块的顺序，并提前将其读入内存，就能够减少等待IO完成所花费的时间。

实现过程：
当系统调用ReadBuffer存取数据库中的一个数据页时：

通过预取算法，使得系统存取这些页是，它们已在缓冲区中；
同时通过分析算法实现过程，可以发现该算法尽量保证了预取的命中率；否则频频无法命中的预取只会浪费系统系能，造成负面影响。

在一些测试资料中可以看到，PostgreSQL通过实现这种算法，比较大的降低了响应时间，但是吞吐量并不会收到明显影响。

这是符合预期的：预取算法其实是通过减少系统空闲来提高性能，并不是在硬件性能上有突破性的优化。

最后编辑于：2017.12.05 06:01:41

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。