1. 什么叫做IO密集型(IO-bound)
什么叫做IO?
- IO是在主存与外部设备(磁盘驱动器、终端和网络)之间的数据拷贝的过程。
- 站在主存的角度去看,I表示输入到主存;O从主存输出。
什么叫做IO密集型?
- 就是IO很多呗。比如大量的“数据写入磁盘,数据上传到远程服务器,从磁盘读取文件”等操作。
2.磁盘IO
- 指标(外设拖了主存的后腿)
磁盘 | 耗时 |
---|---|
Main memory reference | 100ns |
Disk seek | 8~10ms |
Read 1MB sequentially from disk | 20~25ms |
机械磁盘吞吐量 | 120MB |
3. 从cpu下发指令到IO整个流程(计算某一个文件的行数)
<b>3.1 程序可能是这样写的</b>
- open()
- read() #读取x字节,返回0表示读完或-1表示出错,则退出。
- 判断是否包含'\n','\r','\r\n',如果是则count++; 否则回到2继续读 取。
<b>3.2 面对上面的程序,机器部件都怎么运作的呢?</b>
注:
- VFS: 对ext3/ext4/ZFS文件系统的虚拟接口(一层抽象,不管你底层是什么文件系统,对于上层来说都是统一的接口)
- 卷管理器:文件系统可以建立在多块磁盘上。卷把多块磁盘组合成一个虚拟磁盘(一层抽象)
- 块设备接口:通用的块层接口(一层抽象,磁盘、usb、CD-ROM都是块设备,对于上层来说都是统一的接口)
- IO驱动:向设备发出命令、读出设备的状态。每一个连接到计算机上的IO设备都需要特定的代码来对其进行控制。这样的代码叫做设备驱动程序。每一个操作系统都有自己的驱动程序,属于内核一部分。如果每一次出现一个新的设备,都必须为新设备更改操作系统的话,那就完蛋了。所以,操作系统定义的统一的设备驱动程序接口,不同厂商按照接口来实现即可。
- 总线适配器驱动(控制器驱动):将IO总线连接到控制器。控制传输的驱动程序。
- 磁盘设备
- 磁盘控制器:从磁盘中按照串行位流方式读取数据。在自己内部缓存区中组装成一个字节块,校验数据没有错误后,再将复制到内存。(反向同理)
- 磁盘驱动器:接收IO请求,排队,寻道,返回IO数据。
大概步骤如下:(CPU只负责发指令,然后干其他事情——采用程序中断+IO端口独立编址。还有其他DMA、内存IO映射统一编址方式)
- open调用,从文件系统中读取文件属性和磁盘地址表,并装入内存中
- 将文件的地址写入寄存器
- CPU读到IN/OUT指令。启动中断,下发指令到控制器中要读取该地址的数据,CPU就干其他事情了。
- 磁盘控制器从磁盘驱动器中串行地一位一位读一个块,直到整个块放入控制器内部的缓存区。
- 磁盘控制器产生一个中断。等待CPU响应中断继续服务。
- 中断控制器看总线情况是否繁忙,以及中断优先级,来做中断标志位。
- CPU看到中断标志位信息OK,就下发指令拷贝到内存中。
- 磁盘控制器将数据传达内存。