bio,nio,aio的区别 select,poll,epoll的区别

1.先了解一些基本概念,什么是socket？什么是I/O操作

unix(like)世界里，一切皆文件，而文件是什么呢？文件就是一串二进制流而已，不管socket,还是FIFO、管道、终端，对我们来说，一切都是文件，一切都是流

在信息交换的过程中，我们都是对这些流进行数据的收发操作，简称为I/O操作(input and output)

计算机里有这么多的流，我怎么知道要操作哪个流呢？对，就是文件描述符，即通常所说的fd，一个fd就是一个整数，所以，对这个整数的操作，就是对这个文件（流）的操作。我们创建一个socket,通过系统调用会返回一个文件描述符，那么剩下对socket的操作就会转化为对这个描述符的操作

2.简述下IO操作

IO操作主要分为两个步骤，即发起IO请求和实际IO操作。

一次写操作分为两步：将数据从用户空间拷贝到系统空间；从系统空间往网卡写。

一次读操作分为两步：将数据从网卡拷贝到系统空间；将数据从系统空间拷贝到用户空间。

同步IO/异步IO的区别在于第二步骤（实际IO操作）是否阻塞；阻塞IO/非阻塞IO的区别在于第一个步骤（发起IO）是否阻塞。

3.同步IO、异步IO、阻塞IO、非阻塞IO

同步IO：若实际IO操作阻塞请求进程，即请求进程需要等待或者轮询查看IO操作是否完毕。不管是BIO,NIO,还是IO多路复用，从内核缓存写入用户缓存一定是由用户线程自行读取数据，处理数据

异步IO：若实际IO操作并不阻塞请求进程，而是由操作系统来进行实际IO操作并将结果返回给请求的进程。数据是内核写入的，并放在了用户线程指定的缓存区，写入完毕后通知用户线程

阻塞IO：若发起IO请求后，请求线程一直等待实际IO操作完成。数据从网关写到内核，如果没写好,线程就一直在等待。

非阻塞IO：若发起IO请求后，请求线程直接返回，而不会一直等待。数据从网关写到内核，用一个线程轮询的去查看所有的数据是否准备好(I/O多路复用,监听多个socket)

4.同步异步、阻塞非阻塞

BIO：同步阻塞IO，服务器实现模式为一个连接一个线程，即客户端有连接请求时服务器就需要启动一个线程进行处理，如果这个连接不做任何事情会造成不必要的线程开销，当然也可以使用线程池机制来改善。

BIO还有一种变种,伪异步IO,当有新的客户端接入时，将客户端的socket封装成一个task，丢到线程池中处理。优化了后续处理线程的方式

NIO：同步非阻塞IO，服务器实现模式为一个请求一个线程，即客户端发送的连接请求都会被注册到多路复用器上，多路复用器轮询到连接有IO请求时才会启动一个线程进行处理。

AIO：异步非阻塞IO(异步一定是非阻塞)，服务器实现模式为有一个有效请求一个线程，客户端的IO请求都是由操作系统先完成IO操作后再通知服务器应用来启动线程进行处理。

5.再来看看I/O多路复用的三种形式

select:知道了有I/O事件发生了，却并不知道是哪那几个流（可能有一个，多个，甚至全部），我们只能无差别轮询所有流，找出能读出数据，或者写入数据的流，对他们进行操作。所以select具有O(n)的无差别轮询复杂度，同时处理的流越多，无差别轮询时间就越长

poll:本质上和select没有区别，它将用户传入的数组拷贝到内核空间，然后查询每个fd对应的设备状态，但是它没有最大连接数的限制，原因是它是基于链表来存储的

epoll(Linux内核所特有):可以理解为event poll，不同于忙轮询和无差别轮询，epoll会把哪个流发生了怎样的I/O事件通知我们。所以我们说epoll实际上是事件驱动（每个事件关联上fd）的，此时我们对这些流的操作都是有意义的。（复杂度降低到了O(1)）(Epoll最大的优点就在于它只管你“活跃”的连接，而跟连接总数无关，因此在实际的网络环境中，Epoll的效率就会远远高于select和poll)

注意:表面上看epoll的性能最好，但是在连接数少并且连接都十分活跃的情况下，select和poll的性能可能比epoll好，毕竟epoll的通知机制需要很多函数回调

6.三种I/O多路复用方式优缺点比较

select的优缺点：

优点：

（1）select的可移植性好，在某些unix下不支持poll。

（2）select对超时值提供了很好的精度，精确到微秒，而poll式毫秒。

缺点：

（1）单个进程可监视的fd数量被限制，默认是1024。

（2）需要维护一个用来存放大量fd的数据结构，这样会使得用户空间和内核空间在传递该结构时复制开销大。

（3）对fd进行扫描时是线性扫描，fd剧增后，IO效率降低，每次调用都对fd进行线性扫描遍历，随着fd的增加会造成遍历速度慢的问题。

（4）select函数超时参数在返回时也是未定义的，考虑到可移植性，每次超时之后进入下一个select之前都要重新设置超时参数。

poll的优缺点：

优点：

（1）不要求计算最大文件描述符+1的大小。

（2）应付大数量的文件描述符时比select要快。

（3）没有最大连接数的限制是基于链表存储的。

缺点：

（1）大量的fd数组被整体复制于内核态和用户态之间，而不管这样的复制是不是有意义。

（2）同select相同的是调用结束后需要轮询来获取就绪描述符。

epoll的优缺点（epoll详解）：

（1）支持一个进程打开大数目的socket描述符(FD)

（2）IO效率不随FD数目增加而线性下降

7.最后回来看看java内核的NIO的实现

缓冲区Buffer

缓冲区实际上是一个数组，封装了对数据结构化访问以及维护读写位置等信息

在NIO库中，所有数据都是用缓冲区处理的，在读取数据时，直接读取到缓冲区。写入数据时，直接写入写缓冲区。任何时候访问NIO中的数据，都是通过缓冲区进行操作

最常用的的缓冲区是ByteBuffer。大部分Java基本类型都对应一种缓冲区

通道channel

Channel 是一个通道，可以通过它读取和写入数据。InputStream和OutputStream各自只能在一个方向上操作

Channel是全双工的，所以它可以比流更好地映射底层的api

多路复用器Selector

Selector是NIO的编程基础。多路复用器提供选择已经就绪的任务的能力

Selector会不断轮询注册在其上的Channel，如果channel上面有了新的TCP连接、读取或者写事件，这个channel就是就绪状态，会被Selector轮询出来。然后通过SelectionKey集合可以获取就绪的Channel集合，进行IO操作

一个Selector可以同时轮询多个Channel，由于JDK使用了epoll（）代替传统的select实现，所以没有最大连接句柄1024/2048的限制。这意味着只需要一个线程负责Selector的轮询，就可以接入成千上万的客户端

NIO服务端序列图

NIO客服端序列图

简单版本的交互图

bio,nio,aio的区别 select,poll,epoll的区别

友情链接更多精彩内容