高性能IO IO模型

高性能IO 第一次分享

声明：本文用于内部分享使用，图文多来源于网络

总述

IO（Input/Output）在计算机中主要指文件读写，网络通讯。本文的概念只针对网络IO，文件读写可能与本文有所差异。
本文是高性能IO主题的第一次分享，内容包括三部分：基本IO模型，Netty概述，性能瓶颈点概述。

1、基本IO模型

1.1 阻塞IO

当用户线程发出IO请求之后，内核会去查看数据是否就绪，如果没有就绪就会等待数据就绪，而用户线程就会处于阻塞状态。当数据就绪之后，内核会通知用户线程，用户线程从阻塞状态恢复执行。
阻塞IO对应java中的BIO，下图和代码简述了BIO的基本使用。阻塞IO对应java中的BIO，下图和代码简述了BIO的基本使用。

block.png

public class IOServer {
    public static void main(String[] args) throws Exception {
        ServerSocket serverSocket = new ServerSocket(8000);
        // (1) 接收新连接线程
        new Thread(() -> {
            while (true) {
                try {
                    // (1) 阻塞方法获取新的连接
                    Socket socket = serverSocket.accept();
                    // (2) 每一个新的连接都创建一个线程，负责读取数据
                    new Thread(() -> {
                        try {
                            byte[] data = new byte[1024];
                            InputStream inputStream = socket.getInputStream();
                            while (true) {
                                int len;
                                // (3) 按字节流方式读取数据
                                while ((len = inputStream.read(data)) != -1) {
                                    System.out.println(new String(data, 0, len));
                                }
                            }
                        } catch (IOException e) {
                        }
                    }).start();
                } catch (IOException e) {
                }
            }
        }).start();
    }
}

阻塞IO因模型简单，同步等的方式使代码流程清晰，并可与多线程、进程配合提高吞吐量的优点，一些服务器比如apache。另外客户端或者服务端中代码访问数据库，网络的一般也是同步IO的方式。

1.2 非阻塞IO

调用read时，如果有数据收到，就返回数据，如果没有数据收到，就立刻返回一个错误，如EWOULDBLOCK。这样是不会阻塞线程了，但是你还是要不断的轮询来读取或写入。

noblock.png

1.3 多路复用

IO multiplexing 这里面的 multiplexing 指的其实是在单个线程通过记录跟踪每一个Sock(I/O流)的状态,来同时管理多个I/O流以尽量多的提高服务器的吞吐能力

select.png


public class NIOServer {

    public void listen() throws IOException {
        System.out.println("服务端启动成功！");
        // 轮询访问selector
        while (true) {

            // 当注册的事件到达时，方法返回；否则,该方法会一直阻塞
            selector.select();
            // 获得selector中选中的项的迭代器，选中的项为注册的事件
            Iterator<?> ite = this.selector.selectedKeys().iterator();
            while (ite.hasNext()) {
                SelectionKey key = (SelectionKey) ite.next();
                // 删除已选的key,以防重复处理
                ite.remove();
                handler(key);
            }
        }
    }
}

select, poll, epoll 都是I/O多路复用的具体的实现对应NIO中的 Selector 会根据系统选择最高性能的实现 linux系统下均为epoll，可以参考这篇文章了解epoll为何高效？

epoll为何高效？

1.4 AIO异步IO

异步io 是只当数据由操作系统写入用户准备的缓冲区后，回调用户提供的注册函数进行处理的IO方式

aio.png


public class AioServer {

    private void init(int port) {
        System.out.println("server starting at port "+port+"..");
        // 初始化定长线程池
        service = Executors.newFixedThreadPool(4);
        try {
            // 初始化 AsyncronousServersocketChannel
            serverChannel = AsynchronousServerSocketChannel.open();
            // 监听端口
            serverChannel.bind(new InetSocketAddress(port));
            // 监听客户端连接,但在AIO，每次accept只能接收一个client，所以需要
            serverChannel.accept(this, new AioHandler());
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}


public class AioHandler implements CompletionHandler<AsynchronousSocketChannel, AioServer> {
    private void doRead(AsynchronousSocketChannel clientChannel) {
        ByteBuffer buffer = ByteBuffer.allocate(1024);
        clientChannel.read(
                buffer,   // 用于数据中转缓冲区
                buffer,   // 用于存储client发送的数据的缓冲区
                new CompletionHandler<Integer, ByteBuffer>() {
                    @Override
                    public void completed(Integer result, ByteBuffer attachment) {
                       
                        System.out.println("from client : " + 
                                           new String(attachment.array(), StandardCharsets.UTF_8));
                        // 向client写入数据
                        doWrite(clientChannel);
                    }

                    @Override
                    public void failed(Throwable exc, ByteBuffer attachment) {
                    }
                }
        );
    }
}

AIO 这么好用的模型为何并没有得到大量应用？
netty为何没有使用aio
聊聊BIO，NIO和AIO

2、Netty网络框架

2.1 Reactor模式

reactor是一种基于事件驱动，由分发器通知使用者完成读取处理的网络模型，可以以极少的线程处理大量的连接。
具体到netty 可以描述为 NioEventLoop基于Selector多路复用器获取事件并分发到注册的用户程序，用户程序读取数据完成业务的过程。EventLoop即为分发器，Selector即为事件驱动器。

额外内容：
Proactor模式
proactor模式区别在于用户准备缓冲区，当缓冲区数据写入完成后，通知用户程序，是异步的处理过程。而reactor则是通知的就绪事件，需要用户同步读取就绪数据。

2.2 为什么用netty?

1.使用JDK自带的NIO需要了解太多的概念，编程复杂，一不小心bug横飞,比如空轮询。
2.Netty自带的拆包解包，异常检测等机制，支持各种协议，让你只需要关心业务逻辑。
3.Netty已经历各大rpc框架，消息中间件，分布式通信中间件线上的广泛验证，健壮性无比强大。

2.3 netty的结构

netty.jpeg


public class NettyServer {
    public static void main(String[] args) {
        ServerBootstrap serverBootstrap = new ServerBootstrap();
        NioEventLoopGroup boss = new NioEventLoopGroup();
        NioEventLoopGroup worker = new NioEventLoopGroup();
        serverBootstrap
                .group(boss, worker)
                .channel(NioServerSocketChannel.class)
                .childHandler(new ChannelInitializer<NioSocketChannel>() {
                    protected void initChannel(NioSocketChannel ch) {
                        ch.pipeline().addLast(new StringDecoder());
                        ch.pipeline().addLast(new SimpleChannelInboundHandler<String>() {
                            @Override
                            protected void channelRead0(ChannelHandlerContext ctx, String msg) {
                                System.out.println(msg);
                            }
                        });
                    }
                })
                .bind(8000);
    }
}

1.netty中一个EventLoop对应一个多路复用器Selector,一个EventLoopGroup对应多个EventLoop
2.netty 将用于accept的事件使用单独的EventLoopGroup,一般只有一个EventLoop来处理应用的连接事件。
3.netty使用区分于accept的EventLoopGroup 一般会有对应cpu core数量对应的EventLoop来处理应用的读写操作。4.一般来说用户在自行管理的线程池中完成业务处理过程。

3、瓶颈在哪？

回头查看同步IO部分的描述--客户端或者服务端中代码访问数据库，网络的一般也是同步IO的方式--，同时结合netty使用实践中主要的使用模式均为使用线程池来处理用户业务可能存在的同步业务逻辑。

这样有什么问题吗？

随着机器性能增加，支持的并发量增加的同时，以下问题开始导致新的性能问题
1.大量线程处于等待状态线程本身至少分配1M以上的预留栈空间对于并发要求很高的模块是很大的浪费。
2.大量的线程上下文切换。
如下代码

String redisStr = redisTemplate.get(key); //wait-1
if (redisStr == null) {
    List<Object> myDatas = jpa.get();//wait-2
    redisTemplate.set(key, gson.toJson(myDatas));//wait-3
    return myDatas;
}

上面这段代码是使用缓存miss时最场景的场景在简单的几句代码中线程就会有3*2的状态上下文切换，线程大部分时间都在空等mysql或者redis操作。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,496评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,407评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,632评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,180评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,198评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,165评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,052评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,910评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,324评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,542评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,711评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,424评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,017评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,668评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,823评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,722评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,611评论 2赞 353