1.先了解一些基本概念,什么是socket?什么是I/O操作
unix(like)世界里,一切皆文件,而文件是什么呢?文件就是一串二进制流而已,不管socket,还是FIFO、管道、终端,对我们来说,一切都是文件,一切都是流
在信息交换的过程中,我们都是对这些流进行数据的收发操作,简称为I/O操作(input and output)
计算机里有这么多的流,我怎么知道要操作哪个流呢?对,就是文件描述符,即通常所说的fd,一个fd就是一个整数,所以,对这个整数的操作,就是对这个文件(流)的操作。我们创建一个socket,通过系统调用会返回一个文件描述符,那么剩下对socket的操作就会转化为对这个描述符的操作
2.简述下IO操作
IO操作主要分为两个步骤,即发起IO请求和实际IO操作。
一次写操作分为两步:将数据从用户空间拷贝到系统空间;从系统空间往网卡写。
一次读操作分为两步:将数据从网卡拷贝到系统空间;将数据从系统空间拷贝到用户空间。
同步IO/异步IO的区别在于第二步骤(实际IO操作)是否阻塞;阻塞IO/非阻塞IO的区别在于第一个步骤(发起IO)是否阻塞。
3.同步IO、异步IO、阻塞IO、非阻塞IO
同步IO:若实际IO操作阻塞请求进程,即请求进程需要等待或者轮询查看IO操作是否完毕。不管是BIO,NIO,还是IO多路复用,从内核缓存写入用户缓存一定是由 用户线程自行读取数据,处理数据
异步IO:若实际IO操作并不阻塞请求进程,而是由操作系统来进行实际IO操作并将结果返回给请求的进程。数据是内核写入的,并放在了用户线程指定的缓存区,写入完毕后通知用户线程
阻塞IO:若发起IO请求后,请求线程一直等待实际IO操作完成。数据从网关写到内核,如果没写好,线程就一直在等待。
非阻塞IO:若发起IO请求后,请求线程直接返回,而不会一直等待。数据从网关写到内核,用一个线程轮询的去查看所有的数据是否准备好(I/O多路复用,监听多个socket)
4.同步异步、阻塞非阻塞
BIO:同步阻塞IO,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,当然也可以使用线程池机制来改善。
BIO还有一种变种,伪异步IO,当有新的客户端接入时,将客户端的socket封装成一个task,丢到线程池中处理。优化了后续处理线程的方式
NIO:同步非阻塞IO,服务器实现模式为一个请求一个线程,即客户端发送的连接请求都会被注册到多路复用器上,多路复用器轮询到连接有IO请求时才会启动一个线程进行处理。
AIO:异步非阻塞IO(异步一定是非阻塞),服务器实现模式为有一个有效请求一个线程,客户端的IO请求都是由操作系统先完成IO操作后再通知服务器应用来启动线程进行处理。
5.再来看看I/O多路复用的三种形式
select:知道了有I/O事件发生了,却并不知道是哪那几个流(可能有一个,多个,甚至全部),我们只能无差别轮询所有流,找出能读出数据,或者写入数据的流,对他们进行操作。所以select具有O(n)的无差别轮询复杂度,同时处理的流越多,无差别轮询时间就越长
poll:本质上和select没有区别,它将用户传入的数组拷贝到内核空间,然后查询每个fd对应的设备状态, 但是它没有最大连接数的限制,原因是它是基于链表来存储的
epoll(Linux内核所特有):可以理解为event poll,不同于忙轮询和无差别轮询,epoll会把哪个流发生了怎样的I/O事件通知我们。所以我们说epoll实际上是事件驱动(每个事件关联上fd)的,此时我们对这些流的操作都是有意义的。(复杂度降低到了O(1))(Epoll最大的优点就在于它只管你“活跃”的连接,而跟连接总数无关,因此在实际的网络环境中,Epoll的效率就会远远高于select和poll)
注意:表面上看epoll的性能最好,但是在连接数少并且连接都十分活跃的情况下,select和poll的性能可能比epoll好,毕竟epoll的通知机制需要很多函数回调
6.三种I/O多路复用方式优缺点比较
select的优缺点:
优点:
(1)select的可移植性好,在某些unix下不支持poll。
(2)select对超时值提供了很好的精度,精确到微秒,而poll式毫秒。
缺点:
(1)单个进程可监视的fd数量被限制,默认是1024。
(2)需要维护一个用来存放大量fd的数据结构,这样会使得用户空间和内核空间在传递该结构时复制开销大。
(3)对fd进行扫描时是线性扫描,fd剧增后,IO效率降低,每次调用都对fd进行线性扫描遍历,随着fd的增加会造成遍历速度慢的问题。
(4)select函数超时参数在返回时也是未定义的,考虑到可移植性,每次超时之后进入下一个select之前都要重新设置超时参数。
poll的优缺点:
优点:
(1)不要求计算最大文件描述符+1的大小。
(2)应付大数量的文件描述符时比select要快。
(3)没有最大连接数的限制是基于链表存储的。
缺点:
(1)大量的fd数组被整体复制于内核态和用户态之间,而不管这样的复制是不是有意义。
(2)同select相同的是调用结束后需要轮询来获取就绪描述符。
epoll的优缺点(epoll详解):
(1)支持一个进程打开大数目的socket描述符(FD)
(2)IO效率不随FD数目增加而线性下降
7.最后回来看看java内核的NIO的实现
缓冲区Buffer
缓冲区实际上是一个数组,封装了对数据结构化访问以及维护读写位置等信息
在NIO库中,所有数据都是用缓冲区处理的,在读取数据时,直接读取到缓冲区。写入数据时,直接写入写缓冲区。任何时候访问NIO中的数据,都是 通过缓冲区进行操作
最常用的的缓冲区是ByteBuffer。大部分Java基本类型都对应一种缓冲区
通道channel
Channel 是一个通道,可以通过它读取和写入数据。InputStream和OutputStream各自只能在一个方向上操作
Channel是全双工的,所以它可以比流更好地映射底层的api
多路复用器Selector
Selector是NIO的编程基础。多路复用器提供选择已经就绪的任务的能力
Selector会不断轮询注册在其上的Channel,如果channel上面有了新的TCP连接、读取或者写事件,这个channel就是就绪状态,会被Selector轮询出来。然后通过SelectionKey集合可以获取就绪的Channel集合,进行IO操作
一个Selector可以同时轮询多个Channel,由于JDK使用了epoll()代替传统的select实现,所以没有最大连接句柄1024/2048的限制。这意味着只需要一个线程负责Selector的轮询,就可以接入成千上万的客户端
NIO服务端序列图
NIO客服端序列图
简单版本的交互图