c标准I/O的缓存

这篇博客简单介绍了标准输入/输出相关的缓存机制。
标准输入/输出库是由IOS C定义的,与直接使用系统调用进行读、写相比,标准输入/输
出帮助我们处理了很多细节,比如:缓存分配、一次读、写的合适大小等。但标准输入
输出库的缓存机制也会引发很多其他问题。

令人困惑的输出....

printf是标准I/O库函数函数之一,看下面一段程序

#include <stdio.h>
#include <unistd.h>

int
main(int argc, char *argv[])
{
    printf("hello standard I/O");
    sleep(5);
    printf(" after 5 seconds\n");
    sleep(5)
    printf("after another 5 seconds\n");
}

上述程序很简单,咋一看这个程序的运行过程应当是:

1. 输出字符串hello standard I/O
2. 睡眠5秒钟
3. 输出字符串after 5 seconds
4. 睡眠5秒钟
5. 输出字符after anthor 5 seconds
6. 退出程序

然而,如果实际运行的过程是:

1. 睡眠5秒钟
2. 输出字符串hello standard I/O
3. 输出字符串after 5 seconds
4. 睡眠5秒钟
5. 输出字符串after anthor 5 seconds
6. 退出程序

为什么会这样呢?因为printf是有缓存区的,只有在特定情况(比如遇到换行符)下才会
刷新缓存区,真正向屏幕输出字符串,这就是为什么hello standard I/O并不会马上输出
,而是等5秒后和after 5 seconds一起输出。
深入到printf缓存机制内部,我们重新解析上面程序运行过程,这时这段程序其实并不
像看起来那么简单:

1. printf函数收到输出字符串hello standard I/O的请求, 字符串先进入缓存区,没达到
刷新缓存区的条件,并不真正地输出字符串
2. 睡眠5秒钟
3. printf函数再次收到输出字符串after 5 seconds\n的请求,字符串进入缓存区,缓存区
的字符串包含换行符,调用操作系统调用,输出缓存区内换行符前的所有字符串:
hello standard I/O after 5 seconds
4. 睡眠5秒钟
5. printf函数收到输出字符串after anthor 5 seconds\n的请求,字符串进入缓存区,缓存
区的字符串包含换行符,调用操作系统调用,输出缓存区内换行符前的所有字符串:
after anthor 5 seconds

缓存

绝大多数标准I/O函数都包含缓存,这意味着某些情况下,一个针对磁盘的写请求只是更新了
缓冲区,要等到满足某些条件时,才会真正刷新缓冲区的变更到磁盘。缓存是为了减少系统
调用的次数,提高I/O效率,因为类似刷新缓存区到磁盘的操作需要系统调用,
而系统调用开销比较大。

标准I/O函数中有3种类型的缓存

  1. 全缓存(fully buffered)
    只有缓存区满了的情况下,才会刷新缓存区
  2. 行缓存(line buffered)
    行缓存一般用于终端输入和输出
    行缓存刷新缓存的情况有
    2.1. 遇到换行符
    2.2. 缓存区满了
    2.3. 输入流是无缓存或者行缓存类型,输入前,会刷新所有的行缓存类型的输出流
  3. 无缓存(unbuffered)

更高效I/O

标准I/O中的缓存导致了数据不必要的重复拷贝,即数据先从内核拷贝到标准I/O的缓存区,
然后数据从标准缓存区拷贝到用户指定的地址中。有一些库试图通过减少这种拷贝来提高
I/O读写效率

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。