块设备在linux中的分类
块设备通俗点就是可以随机寻址的设备,内存,软盘,硬盘这些都是块设备。linux给外设分了几个大类别
1代表内存设备,2代表软盘,3代表硬盘,4代表ttyx,5代表tty,6代表串行端口。这些一般叫做主设备号,还有一个子设备号,一个主设备号+子设备号可以唯一确定一个设备,也就确定了他的驱动程序。比如硬盘,0x300代表第一块硬盘,0x301则代表第一块硬盘的第一块分区,一个硬盘最多有4个分区,相应的0x305则代表第二块硬盘,0x306代表第二块硬盘的第二个分区。
linux是把一切都当做文件的,所以/dev目录下的其实就是这些设备,所以/dev/fd0其实代表第一个软盘。
* 0 - 没有用到(nodev)
* 1 - /dev/mem 内存设备。
* 2 - /dev/fd 软盘设备。
* 3 - /dev/hd 硬盘设备。
* 4 - /dev/ttyx tty 串行终端设备。
* 5 - /dev/tty tty 终端设备。
* 6 - /dev/lp 打印设备。
* 7 - unnamed pipes 没有命名的管道。
硬盘读写过程
内核的其他程序读写内容的时候,都是对高速缓冲区进行读写,只有高速缓冲区在特定的时机会去调用底层驱动从外设读写内容。当一个读指令到高速缓冲区后,缓冲池内没有该块的时候就会找到一个新的缓冲节点,然后调用ll_rw_block去读,ll_rw_block又会根据dev的主设备号去找到实际的驱动程序调用,比如这里是硬盘,就会调用硬盘的do_hd_request。但在把指令实际发送到驱动器之前,linux先把请求信息构造成了一个request类,放到了一个链表中,并用电梯算法给请求排序,因为我们知道硬盘这种设备是靠指针的移动来读取信息的,电梯算法是保证指针磁头往一个方向移动,这样可以一定程度提高吞吐率。但这样也就造成了硬盘读取的顺序和请求的顺序并不一致了。
当执行do_hd_request的时候,从执行链表取出一个来执行,因为0.11版本是单核的,程序在这里会把硬盘完成后的中断调用的方法放在一个全局变量中,因为是单核的,所以下次硬盘中断产生的时候执行的回调一定是对应这次的。剩下的就是往对应的端口发送计算好的磁道等信息,注意,驱动程序只会跟控制器打交道,控制器收到请求后会再去调度硬盘的磁头工作,所以这儿跟控制器确定好了之后,实际会有很长一段时间内硬盘才会完成工作。所以这儿会立马返回到内核原程序,在这儿内核就让进程睡眠了,等待驱动程序完成后会显式地唤醒它。
堵塞模式,select,poll
很开心,其实最初想学习内核也就是想解决我的一些困惑,因为以前很多时候我并不知道代码这样写是为了什么,为什么调用print就可以在显示器输出内容,为什么folk就有两个进程等等。问了很多人,他们都说根在C语言,但我学习了一遍C语言,发现这门语言内容特别少,学完后并没有解决我的困惑。然后开始看一些计算机原理,才接触到内核,才知道其实很多东西都是内核提供的。
好了扯这么多,看到现在,其实就很好理解阻塞模式了,当我们用户程序调用read,write的时候,其实是启动了一个系统调用,由内核去根据fd去找到真正的节点然后调用底层的驱动去从硬盘读写。在等待硬盘读写的过程中,是一个漫长的时间,所以内核就会去启动调度程序选一个其他的进程来执行,这样不会白白浪费我们的cpu。当驱动程序从硬盘吧内容读写好了后,会通过中断高速cpu,cpu也会知道是哪个进程发出的这次请求,然后就会显式的唤醒哪个进程,于是那个进程就又愉快的执行了。
select,有一定网络程序编程经验的都知道,堵塞模式不太好,如果是个web服务器用堵塞模式,那么一个进程只能处理一个客户端连接了,如果要处理多个请求只能选择多进程或多线程。但有一种办法叫select,它可以同时监控多个文件(socket其实也是一种文件抽象)
那我们看了这么久内核代码,其实想实现一个select其实就挺容易的了(思路至少有了),我们可以给进程里请来一个代理,这个代理就叫select,以前进程只能堵塞在一个fd上,这个代理就厉害多了,他可以监控多个fd,其实方法也很简单,就是每次有驱动程序完成后,发现有select存在,就唤醒它,select就拿着这个新更新的fd和自己监控的fd们挨个比较一下,如果是在自己监控的队列中,就把委托自己当代理的进程给唤醒,这样进程就可以监控多个fd了。