本文主要理清非阻塞IO,记录锁,IO多路转接,异步IO,readv和writev函数以及存储映射IO。
学习
1、同步、异步,阻塞和非阻塞等概念
同步和异步
同步和异步关注的是消息通信机制 (synchronous communication/ asynchronous communication)所谓同步,就是在发出一个调用时,在没有得到结果之前,该调用就不返回。但是一旦调用返回,就得到返回值了。换句话说,就是由调用者主动等待这个调用的结果。而异步则是相反,调用在发出之后,这个调用就直接返回了,所以没有返回结果。换句话说,当一个异步过程调用发出后,调用者不会立刻得到结果。而是在调用发出后,被调用者通过状态、通知来通知调用者,或通过回调函数处理这个调用。
阻塞与非阻塞
阻塞和非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态。阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。
所以说,同步和异步针对的是消息通知机制,我要得到这个消息是自己一直等待还是被调用者在处理完后通知调用者。而阻塞非阻塞是针对本身线程或进程来说。线程或进程要一直等待则是阻塞,可以不等待处理其他任务为非阻塞。
以下来源网络:
出场人物:老张,水壶两把(普通水壶,简称水壶;会响的水壶,简称响水壶)。
- 1 老张把水壶放到火上,立等水开。(同步阻塞)
- 2 老张把水壶放到火上,去客厅看电视,时不时去厨房看看水开没有。(同步非阻塞)
老张还是觉得自己有点傻,于是变高端了,买了把会响笛的那种水壶。水开之后,能大声发出嘀~~~~的噪音。 - 3 老张把响水壶放到火上,立等水开。(异步阻塞)老张觉得这样傻等意义不大
- 4 老张把响水壶放到火上,去客厅看电视,水壶响之前不再去看它了,响了再去拿壶。(异步非阻塞)
2、记录锁
当一个进程修改正在读或修改文件的某个部分时,使用记录锁可以防止其他进程修改同一文件区。
3、 IO多路转接
以tenent为例子,既要从标准输入读,也要从网络连接读,将所得数据写在终端上,如果在一个读上面阻塞,将会导致另一个未处理而可能的数据丢失,处理这种问题可以,可以使用多进程或多进程,但是,有以下问题:
还有一种方法,采用轮询。
还有一种是异步IO,有点类似于中断技术,当描述符准备好可以进行IO时,进程用一个信号通知内核。但也有两个问题,一是可移植性,二是能用的信号数量远小于潜在文件描述符数量(待理解完善)。
一种比较合适的技术是IO多路转接。
select函数
最后一个参数tvptr,表示愿意等待的时间,如下:
中间三个参数:
现在讲讲描述符集,根据上面我们只知道,可以讲感兴趣的描述符添加到以上三种条件中,但如何添加,fd_set有什么操作还是未知。
对于fd_set数据类型,可以进行的操作是分配该类型变量,将该变量值赋给同类型变量值。也可以有以下操作:
select 举例
关于返回值
pselect是select变体,功能基本一样,所使用的超时结构不一样,增加了信号屏蔽字。
说明:select函数不足
1)select最大的缺陷就是单个进程所打开的FD是有一定限制的,它由FD_SETSIZE设置,默认值是1024
2) 采用轮询方式,效率较低
3)需要维护一个用来存放大量fd的数据结构,这样会使得用户空间和内核空间在传递该结构时复制开销大
针对上述问题1,poll机制做了相应改进,但是并没有改善2和3所引入的性能问题。
针对select只能轮询,浪费了大量的CPU时间,epoll机制比较合适
poll函数
关于poll ,select, epoll之间的比较可以参考这篇文章
在select/poll中,进程只有在调用一定的方法后,内核才对所有监视的文件描述符进行扫描,而epoll事先通过epoll_ctl()来注册一个文件描述符,一旦基于某个文件描述符就绪时,内核会采用类似callback的回调机制,迅速激活这个文件描述符,当进程调用epoll_wait()时便得到通知。(此处去掉了遍历文件描述符,而是通过监听回调的的机制。这正是epoll的魅力所在。)