I/O——文件的基础

前言:学习了一波 I/O 相关的知识,记录一下

都是文件(文件基本概念)

所有的 I/O 都是通过读写文件来实现,所有外设、包括网络、终端设备,都被看成文件

也就是说:

所有物理设备抽象成逻辑统一的「文件」使得用户程序访问物理设备与访问真正的磁盘文件完全一致,差别则由内核处理

通常,将键盘和显示器构成的设备称为终端(terminal),对应「标准输入」和「标准(错误)输出文件」,而我们平时说的存在磁盘上的文件都是普通文件

printf 的信息显示在哪里?stdout 文件!

操纵文件的流程

接下来说说,在 c 语言中如何用系统函数操纵文件

文件的创建和打开

  • 创建文件:int creat(char *name, mode_t perms);
    • 创建新文件时,应指定文件名和访问权限,系统返回一个非负整数,它被称为文件描述符 fd(file descriptor)
    • 文件描述符用于标识被创建的文件,在以后对文件的读写等操作时用文件描述符代表文件
  • 打开文件:int open(char *name, int flags, mode_t perms);
    • 标准输入(fd = 0)、标准输出(fd = 1)、和标准错误(fd = 2)三种文件自动打开,而其他文件都要通过 creat 或者 open 函数创建或者打开后才能读写
    • 参数 perms 用于指定文件的访问权限,通常在 open 函数中该参数总是 0,除非以创建方式打开,此时,参数 flags 中应带有 O_CREAT 标志
    • 参数 flags:O_RDONLY, O_WRONLY|O_APPEND, O_RDWR 等,只读,只写,读写

文件的读写

  • 读文件:ssize_t read(int fd, void *buf, size_t n);

    将 fd 中当前位置 k 开始的 n 个字节读到 buf 中,读后当前位置为 k+n。若文件长度为 m,当 k+n>m 时,则读取字节数为 m-k<n,读后当前位置为文件尾。返回实际字节数,当 m = k(EOF) 时,返回值为0。

  • 写文件:ssize_t write(int fd, const void *buf, size_t n);

    • 将 buf 中 n 字节写到 fd 中,从当前位置 k 处开始写。返回实际写入字节数 m,写后当前位置为 k+m。对于普通文件,实际字节数等于 n

    • 对于 read 和 write 系统调用,可以一次读/写任意个字节。显然,按一个物理块大小读/写较好,可减少系统调用次数

    • 有些情况下,真正读/写字节数比设定所需字节数少,这并不是一种错误。在读/写磁盘文件时,除非遇到EOF,否则不会出现这种情况。但当读/写的是终端设备或网络套接字文件、UNIX 管道、Web 服务器等都可能出现这种情况。

文件的定位和关闭

  • 设置读写位置:long lseek(int fd, long offset, int origin);
    • offset 指出相对字节数
    • origin 指出基准:开头(0)、当前位置(1)和末尾(2)
    • 返回的是位置值,若发生错误,则返回 -1
  • 元数据统计:int stat(const *name, struct stat *buf);int fstat(int fd, struct stat *buf);

    • 文件的所有属性信息,包括:文件描述符、文件名、文件大小、创建时间、当前读写位置等,由内核维护,称为文件的元数据(metadata)
    • 用户程序可通过 stat() 或 fstat() 函数查看文件元数据
    • stat 第一个参数是文件名,而 fstat 指出的是文件描述符,除第一个参数类型不同外,其他全部一样。
  • 关闭文件:close(int fd)

stdio.h 部分内容详解

看到了上面这个图片了吗?

FILE 类型是这样一个结构:

typedef struct _iobuf {
    int cnt;
    char* ptr;
    char* base;
    int flag;
    int fd;
}

接下来,我来说说这个结构到底有什么用

带缓冲I/O的实现

  • 从文件 fp 中读数据时,FILE 中定义的缓冲区为输入流缓冲(在内存)
  • 首先要从文件 fp 中读入 1024(缓冲大小 BUFSIZ = 1024)个字节数据到缓存,然后,再按需从缓存中读取 1 个(如 getc)或 n 个(如 fread)字节并返回

看这里的参数:

  • base 保存缓存中的起始位置

  • ptr 保存下一个要读的位置

  • cnt 保存未读部分

但是很多情况下一个 buffer 不足以读取完整的文件,所以我们需要多次从文件中读入缓存中。

对文件写时也一样

  • 向文件 fp 中写数据时,FILE 中定义的缓冲区为输出流缓冲
  • 先向缓存中不断地写 1 个(putc)或者 n 个(fwrite)字符,若遇到换行符或者 \n 写入缓存的时候,则一次性将缓存所有内容写入文件 fp 中
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容