这篇博客简单介绍了标准输入/输出相关的缓存机制。
标准输入/输出库是由IOS C定义的,与直接使用系统调用进行读、写相比,标准输入/输
出帮助我们处理了很多细节,比如:缓存分配、一次读、写的合适大小等。但标准输入
输出库的缓存机制也会引发很多其他问题。
令人困惑的输出....
printf
是标准I/O库函数函数之一,看下面一段程序
#include <stdio.h>
#include <unistd.h>
int
main(int argc, char *argv[])
{
printf("hello standard I/O");
sleep(5);
printf(" after 5 seconds\n");
sleep(5)
printf("after another 5 seconds\n");
}
上述程序很简单,咋一看这个程序的运行过程应当是:
1. 输出字符串hello standard I/O
2. 睡眠5秒钟
3. 输出字符串after 5 seconds
4. 睡眠5秒钟
5. 输出字符after anthor 5 seconds
6. 退出程序
然而,如果实际运行的过程是:
1. 睡眠5秒钟
2. 输出字符串hello standard I/O
3. 输出字符串after 5 seconds
4. 睡眠5秒钟
5. 输出字符串after anthor 5 seconds
6. 退出程序
为什么会这样呢?因为printf
是有缓存区的,只有在特定情况(比如遇到换行符)下才会
刷新缓存区,真正向屏幕输出字符串,这就是为什么hello standard I/O
并不会马上输出
,而是等5秒后和after 5 seconds
一起输出。
深入到printf
缓存机制内部,我们重新解析上面程序运行过程,这时这段程序其实并不
像看起来那么简单:
1. printf函数收到输出字符串hello standard I/O的请求, 字符串先进入缓存区,没达到
刷新缓存区的条件,并不真正地输出字符串
2. 睡眠5秒钟
3. printf函数再次收到输出字符串after 5 seconds\n的请求,字符串进入缓存区,缓存区
的字符串包含换行符,调用操作系统调用,输出缓存区内换行符前的所有字符串:
hello standard I/O after 5 seconds
4. 睡眠5秒钟
5. printf函数收到输出字符串after anthor 5 seconds\n的请求,字符串进入缓存区,缓存
区的字符串包含换行符,调用操作系统调用,输出缓存区内换行符前的所有字符串:
after anthor 5 seconds
缓存
绝大多数标准I/O函数都包含缓存,这意味着某些情况下,一个针对磁盘的写请求只是更新了
缓冲区,要等到满足某些条件时,才会真正刷新缓冲区的变更到磁盘。缓存是为了减少系统
调用的次数,提高I/O效率,因为类似刷新缓存区到磁盘的操作需要系统调用,
而系统调用开销比较大。
标准I/O函数中有3种类型的缓存
- 全缓存(fully buffered)
只有缓存区满了的情况下,才会刷新缓存区 - 行缓存(line buffered)
行缓存一般用于终端输入和输出
行缓存刷新缓存的情况有
2.1. 遇到换行符
2.2. 缓存区满了
2.3. 输入流是无缓存或者行缓存类型,输入前,会刷新所有的行缓存类型的输出流 - 无缓存(unbuffered)
更高效I/O
标准I/O中的缓存导致了数据不必要的重复拷贝,即数据先从内核拷贝到标准I/O的缓存区,
然后数据从标准缓存区拷贝到用户指定的地址中。有一些库试图通过减少这种拷贝来提高
I/O读写效率