都说生产碰到的问题会印象深刻,由于web应用部署使用了公司内部框架,需要进行参数优化,对此进行了一番了解
BIO,NIO,AIO参考资料:
十分钟了解BIO,NIO,AIO(http://loveshisong.cn/%E7%BC%96%E7%A8%8B%E6%8A%80%E6%9C%AF/2016-06-25-%E5%8D%81%E5%88%86%E9%92%9F%E4%BA%86%E8%A7%A3BIO-NIO-AIO.html)
之前看很多资料,都混淆了一些技术点,
理解了之后觉得特别重要的有:
同步和异步,阻塞和非阻塞 ,这个是理解的基础,2个纬度的概念
同步和异步的关注点在于逻辑上流程是否是一步步执行的,是否一定要按顺序执行
阻塞和非阻塞的关注点:指请求结果返回之前, 当前线程会被挂起(被阻塞)IO模型:
Java中的IO操作是JVM配合操作系统来完成的. 对于一个IO的读操作, 数据会先被拷贝到操作系统内核的缓冲区中, 然后从操作系统内核的缓冲区拷贝到应用程序的地址空间. 所以整个过程可分为两个阶段:
1.等待I/O数据准备好. 这取决于IO目标返回数据的速度, 如网络IO时看网速和数据本身的大小.
2.数据从内核缓冲区拷贝到进程内.
根据这两个阶段, 产生了常见的几种不同的IO模型: BIO, NIO, IO多路复用和AIO.-
BIO blcoking IO,最易理解的概念
程序发送请求给内核, 然后由内核去进行通信, 在内核准备好数据之前这个线程是被挂起的, 所以在两个阶段程序都处于挂起状态.
BIO的特点就是在IO执行的两个阶段都被block了。提升性能的主要方法就是多起一些线程。 NIO和多路复用,这是2个概念,只不过经常一起用罢了
-
NIO NON BLOCKING IO
顾名思义,非阻塞IO
NIO的特点就是在第一个阶段,系统内核准备数据的阶段,应用程序线程需要不断的主动询问内核数据是否准备好,此阶段可以做其他事,不回被挂起。第一个阶段非阻塞, 第二个阶段阻塞 IO多路复用
IO多路复用(I/O Multiplexing)有select, poll, epoll等不同方式, 它的优点在于单个线程可以同时处理多个网络IO.
从NIO的角度进行优化,NIO中轮询操作是用户线程进行的, 如果把这个任务交给其他线程, 则用户线程就不用这么费劲的查询状态了. IO多路复用调用系统级别的select或poll模型, 由系统进行监控IO状态. select轮询可以监控许多socket的IO请求, 当有一个socket的数据准备好时就可以返回
select: 注册事件由数组管理, 数组是有长度的, 32位机上限1024, 64位机上限2048. 轮询查找时需要遍历数组.
poll: 把select的数组采用链表实现, 因此没了最大数量的限制
epoll方式: 基于事件回调机制, 回调时直接通知进程, 无须使用某种方式来查看状态.
这三者其实都是实现多路复用的方式
- 此处需要扩展
1.最简单的方式,让应用本身起一个单独的线程,一直去遍历socket的列表 ,缺点是连接空闲时,也会占用cpu资源
2.事件驱动的方式,对1的改进。将遍历的工作交给系统内核。内核将遍历结果组织成事件列表返回给应用层处理。缺点,当套接字连接数量变大,列表从内核复制到应用也是不小的开销。此外,当活跃连接较少时,存在很多无效的数据副本,因为它将活跃和不活跃的链接状态都复制到应用层
3.内核基于回调的事件监测
对于遍历的机制进行优化!内核每个套接字都对应一个回调函数。当客户端发送数据时,内核从网卡接收数据库就会调用回调函数。在回调函数中维护事件列表。应用层获取此事件列表即可
多路复用IO的特点是用户进程能同时等待多个IO请求, 系统来监控IO状态, 其中的任意一个进入读就绪状态, select函数就可以返回.
*AIO
前面讲的都是同步方法,至少第二阶段是同步的,只有AIO才是异步方法
AIO即Asynchronous I/O(异步 I/O), 这是Java 1.7引入的NIO 2.0中用到的. 整个过程中, 用户线程发起一个系统调用之后无须等待, 可以处理别的事情. 由操作系统等待接收内容, 接收后把数据拷贝到用户进程中, 最后通知用户程序已经可以使用数据了, 两个阶段都是非阻塞的. AIO整个过程如下图:
AIO属于异步模型, 用户线程可以同时处理别的事情, 我们怎么进一步加工处理结果呢? Java在这个模型中提供了两种方法:
一种是基于”回调”, 我们可以实现CompletionHandler接口, 在调用时把回调函数传递给对应的API即可
另一种是返回一个Future. 处理完别的事情, 可以通过isDone()可查看是否已经准备好数据, 通过get()方法等待返回数据.