前言:学习了一波 I/O 相关的知识,记录一下
都是文件(文件基本概念)
所有的 I/O 都是通过读写文件来实现,所有外设、包括网络、终端设备,都被看成文件
也就是说:
所有物理设备抽象成逻辑统一的「文件」使得用户程序访问物理设备与访问真正的磁盘文件完全一致,差别则由内核处理
通常,将键盘和显示器构成的设备称为终端(terminal),对应「标准输入」和「标准(错误)输出文件」,而我们平时说的存在磁盘上的文件都是普通文件
printf 的信息显示在哪里?stdout 文件!
操纵文件的流程
接下来说说,在 c 语言中如何用系统函数操纵文件
文件的创建和打开
-
创建文件
:int creat(char *name, mode_t perms);- 创建新文件时,应指定文件名和访问权限,系统返回一个非负整数,它被称为
文件描述符 fd(file descriptor)
- 文件描述符用于标识被创建的文件,在以后对文件的读写等操作时用文件描述符代表文件
- 创建新文件时,应指定文件名和访问权限,系统返回一个非负整数,它被称为
-
打开文件
:int open(char *name, int flags, mode_t perms);- 标准输入(fd = 0)、标准输出(fd = 1)、和标准错误(fd = 2)三种文件自动打开,而其他文件都要通过 creat 或者 open 函数创建或者打开后才能读写
- 参数 perms 用于指定文件的访问权限,通常在 open 函数中该参数总是 0,除非以创建方式打开,此时,参数 flags 中应带有 O_CREAT 标志
- 参数 flags:O_RDONLY, O_WRONLY|O_APPEND, O_RDWR 等,只读,只写,读写
文件的读写
-
读文件
:ssize_t read(int fd, void *buf, size_t n);将 fd 中当前位置 k 开始的 n 个字节读到 buf 中,读后当前位置为 k+n。若文件长度为 m,当 k+n>m 时,则读取字节数为 m-k<n,读后当前位置为文件尾。返回实际字节数,当 m = k(EOF) 时,返回值为0。
-
写文件
:ssize_t write(int fd, const void *buf, size_t n);将 buf 中 n 字节写到 fd 中,从当前位置 k 处开始写。返回实际写入字节数 m,写后当前位置为 k+m。对于普通文件,实际字节数等于 n
对于 read 和 write 系统调用,可以一次读/写任意个字节。显然,按一个物理块大小读/写较好,可减少系统调用次数
有些情况下,真正读/写字节数比设定所需字节数少,这并不是一种错误。在读/写磁盘文件时,除非遇到EOF,否则不会出现这种情况。
但当读/写的是终端设备或网络套接字文件、UNIX 管道、Web 服务器等都可能出现这种情况。
文件的定位和关闭
-
设置读写位置
:long lseek(int fd, long offset, int origin);- offset 指出相对字节数
- origin 指出基准:开头(0)、当前位置(1)和末尾(2)
- 返回的是位置值,若发生错误,则返回 -1
-
元数据统计
:int stat(const *name, struct stat *buf);int fstat(int fd, struct stat *buf);- 文件的所有属性信息,包括:文件描述符、文件名、文件大小、创建时间、当前读写位置等,由内核维护,称为文件的元数据(metadata)
- 用户程序可通过 stat() 或 fstat() 函数查看文件元数据
- stat 第一个参数是文件名,而 fstat 指出的是文件描述符,除第一个参数类型不同外,其他全部一样。
-
关闭文件
:close(int fd)
stdio.h 部分内容详解
看到了上面这个图片了吗?
FILE
类型是这样一个结构:
typedef struct _iobuf {
int cnt;
char* ptr;
char* base;
int flag;
int fd;
}
接下来,我来说说这个结构到底有什么用
带缓冲I/O的实现
- 从文件 fp 中读数据时,FILE 中定义的缓冲区为
输入流缓冲(在内存)
- 首先要从文件 fp 中读入 1024(缓冲大小 BUFSIZ = 1024)个字节数据到缓存,然后,再按需从缓存中读取 1 个(如 getc)或 n 个(如 fread)字节并返回
看这里的参数:
base 保存缓存中的起始位置
ptr 保存下一个要读的位置
cnt 保存未读部分
但是很多情况下一个 buffer 不足以读取完整的文件,所以我们需要多次从文件中读入缓存中。
对文件写时也一样
- 向文件 fp 中写数据时,FILE 中定义的缓冲区为
输出流缓冲
- 先向缓存中不断地写 1 个(putc)或者 n 个(fwrite)字符,若遇到换行符或者 \n 写入缓存的时候,则一次性将缓存所有内容写入文件 fp 中