什么是I/O复用?
所以针对每一种I/O复用的机制,我们需要回答3个问题:
- 多路复用机制会监听套接字上的哪些事件?
- 多路复用机制可以监听多少个套接字?
- 当有套接字就绪时,多路复用机制要如何找到就绪的套接字?
select函数
该函数准许进程指示内核等待多个事件中的任何一个发生,并只在有一个或多个事件发生或经历一段指定的时间后才唤醒。
#include <sys/select.h>
#include <sys/time.h>
int select(int maxfdp1,
fd_set *readset,
fd_set *writeset,
fd_set *exceptset,
const struct timeval *timeout);
若有描述符就绪,则返回其数目,若超时则为0, 若出错则为-1.
第一个参数
maxfdp1
是待测描述符个数,也就是描述符0、1、2......maxfdp1-1均将被轮询。-
第二,三,四参数
fd_set
结构可以理解为一个集合,这个集合中存放的是需要被监听的文件描述符。
readset
、writeset
和exceptset
指定我们要让内核测试读、写、异常条件的描述符集合,如果对某一类的条件不感兴趣,可以把它设为空指针。可以通过下面4个宏编辑描述符集合:
void FD_ZERO(fd_set *fdset); void FD_SET(int fd, fd_set *fdset); void FD_CLR(int fd, fd_set *fdset); int FD_ISSET(int fd, fd_set *fdset);
-
第5个参数:超时控制
struct timeval { long tv_sec; //秒 [long int] long tv_usec; //微秒 [long int] };
这个参数有以下3个可能:
- 永远等待下去,仅在一个描述符准备好I/O才返回,将其设置为NULL即可。
- 等待一段固定的时间:在有一个描述符准备好I/O时返回,但不超过timeval规定的时间
- 根本不等待,检查描述符后立即返回,该参数指定一个
timeval
结构,其中定时器值必须为0,这种情况用得比较少。
描述符就绪条件
- 准备好读(针对socket)
- 该套接字接收缓冲区的数据字节数 >= 套接字接收缓冲区低水位标记的当前大小。(关于"套接字接收缓冲区低水位标记"参见套接字选项)
- 该连接的读半部关闭,也就是接收了FIN得TCP连接
- 该套接字是一个监听套接字,准备好新的连接
- 其上有一个套接字错误待处理
- 准备好写(针对socket)
- 该套接字发送缓冲区能够的可用空间字节数 >= 套接字发送缓冲区低水位标记的当前大小。(关于"套接字发送缓冲区低水位标记"参见套接字选项)
- 该连接的写半部关闭,对这样的套接字的写操作将会产生SIGPIPE错误
- 使用非阻塞式connect的套接字已建立连接,或者connect以失败告终
- 其上有一个套接字错误待处理
- 异常
目前异常条件仅支持2个:- 某个套接字带外数据到达
- ......
使用注意
- 描述符集的初始化非常重要,没有初始化,那么其值无法预料。
- 当我们用FD_ISSET宏来测试fd_set的数据类型中的文件描述符,描述符集内任何未就绪描述符对应的位返回时均被清零,为此,每次重新调用select函数时,我们得再次把描述符集内所关心的位置为1。
- 代码示例:
回射服务器中客户采用select,管理2个fd,一个是socket,一个是标准输入。void str_cli(FILE* fp, int sockfd) { int maxfdp1; char sendline[MAXLINE], recvline[MAXLINE]; fd_set rset; FD_ZERO(&rset); // 描述符集的初始化非常重要 for ( ; ; ) { // 每次重新调用 select 函数时,得再次把描述符集内所关心的位置为1 FD_SET(fileno(fp), &rset); FD_SET(sockfd, &rset); maxfdp1 = max(fileno(fp), sockfd) + 1; select(maxfdp1, &rset, NULL, NULL, NULL); // 套接字文件描述符准备好读 if (FD_ISSET(sockfd, &rset)) { if (readline(sockfd, recvline, MAXLINE) == 0) err_quit("str_cli: server terminated prematurely"); fputs(recvline, stdout); } // 标准输入描述符准备好读 if (FD_ISSET(fileno(fp), &rset)) { if (fgets(sendline, MAXLINE, fp) == NULL) return; write(sockfd, sendline, strlen(sendline)); } } }
缺点
- select如果任何一个sock(IO stream)出现了数据,select就会返回,但是并不会告诉你是哪个sock上有数据,还需要自己线性扫描。
- select会修改传入的参数数组,所以每次要重新设置。
- select 只能监视1024个链接,参见定义在FD_SETSIZE
- select 不是线程安全的
参考资料
[1]《UNIX 网络编程》3th [美] W.Richard Stevens,Bill Fenner,Andrew M. Rudoff
[2] http://www.cnblogs.com/Anker/archive/2013/08/14/3258674.html