I/O——文件的基础

前言：学习了一波 I/O 相关的知识，记录一下

都是文件（文件基本概念）

所有的 I/O 都是通过读写文件来实现，所有外设、包括网络、终端设备，都被看成文件

也就是说：

所有物理设备抽象成逻辑统一的「文件」使得用户程序访问物理设备与访问真正的磁盘文件完全一致，差别则由内核处理

通常，将键盘和显示器构成的设备称为终端（terminal），对应「标准输入」和「标准（错误）输出文件」，而我们平时说的存在磁盘上的文件都是普通文件

printf 的信息显示在哪里？stdout 文件！

接下来说说，在 c 语言中如何用系统函数操纵文件

创建文件：int creat(char *name, mode_t perms);
- 创建新文件时，应指定文件名和访问权限,系统返回一个非负整数，它被称为文件描述符 fd(file descriptor)
- 文件描述符用于标识被创建的文件，在以后对文件的读写等操作时用文件描述符代表文件

打开文件：int open(char *name, int flags, mode_t perms);
- 标准输入（fd = 0）、标准输出（fd = 1）、和标准错误（fd = 2）三种文件自动打开，而其他文件都要通过 creat 或者 open 函数创建或者打开后才能读写
- 参数 perms 用于指定文件的访问权限，通常在 open 函数中该参数总是 0，除非以创建方式打开，此时,参数 flags 中应带有 O_CREAT 标志
- 参数 flags：O_RDONLY， O_WRONLY|O_APPEND， O_RDWR 等，只读，只写，读写

读文件：ssize_t read(int fd, void *buf, size_t n);

将 fd 中当前位置 k 开始的 n 个字节读到 buf 中，读后当前位置为 k+n。若文件长度为 m，当 k+n>m 时，则读取字节数为 m-k<n，读后当前位置为文件尾。返回实际字节数，当 m = k(EOF) 时，返回值为0。

写文件：ssize_t write(int fd, const void *buf, size_t n);
- 将 buf 中 n 字节写到 fd 中，从当前位置 k 处开始写。返回实际写入字节数 m，写后当前位置为 k+m。对于普通文件，实际字节数等于 n
- 对于 read 和 write 系统调用，可以一次读/写任意个字节。显然，按一个物理块大小读/写较好，可减少系统调用次数
- 有些情况下，真正读/写字节数比设定所需字节数少，这并不是一种错误。在读/写磁盘文件时，除非遇到EOF，否则不会出现这种情况。但当读/写的是终端设备或网络套接字文件、UNIX 管道、Web 服务器等都可能出现这种情况。

设置读写位置：long lseek(int fd, long offset, int origin);
- offset 指出相对字节数
- origin 指出基准：开头（0）、当前位置（1）和末尾（2）
- 返回的是位置值,若发生错误,则返回 -1

元数据统计：int stat(const *name, struct stat *buf);int fstat(int fd, struct stat *buf);
- 文件的所有属性信息，包括：文件描述符、文件名、文件大小、创建时间、当前读写位置等，由内核维护，称为文件的元数据（metadata）
- 用户程序可通过 stat() 或 fstat() 函数查看文件元数据
- stat 第一个参数是文件名，而 fstat 指出的是文件描述符，除第一个参数类型不同外，其他全部一样。

看到了上面这个图片了吗？

FILE 类型是这样一个结构：

typedef struct _iobuf {
    int cnt;
    char* ptr;
    char* base;
    int flag;
    int fd;
}

接下来，我来说说这个结构到底有什么用

从文件 fp 中读数据时，FILE 中定义的缓冲区为输入流缓冲（在内存）
首先要从文件 fp 中读入 1024（缓冲大小 BUFSIZ = 1024）个字节数据到缓存，然后，再按需从缓存中读取 1 个（如 getc）或 n 个（如 fread）字节并返回

看这里的参数：

但是很多情况下一个 buffer 不足以读取完整的文件，所以我们需要多次从文件中读入缓存中。

对文件写时也一样