第九周作业

1.编写一个playbook实现Nginx的两种安装过程，安装方式可通过变量传入控制

包安装nginx：

包安装nginx

执行结果

服务启动，80端口已打开

编译安装nginx

编译安装Playbook

执行结果

服务启动，80端口已打开

2.总结http协议版本和工作原理

http/1.0 ：支持cache, MIME, method，每次传输数据时，每次都需要新建立连接

http/1.1 ：引入了持久连接（persistent connection），减少了建立和关闭连接的消耗和延迟

http/2.0 ：复用TCP连接，在一个连接里，客户端和浏览器都可以同时发送多个请求或回应，且不用按顺序响应

工作原理：
一次http事务包括：http请求和http响应。首先客户端发起http请求建立连接（接收或拒绝连接请求），服务端接收请求（接收客户端请求报文中对某资源的一次请求的过程），处理请求（服务器对请求报文进行解析，并获取请求的资源及请求方法等相关信息），访问资源（服务器获取请求报文中请求的资源web服务器，负责向请求者提供对方请求的静态资源，或动态运行后生成的资源），构建响应报文（一旦Web服务器识别除了资源，就执行请求方法中描述的动作，并返回响应报文）然后发送响应报文，最后，当事务结束时，Web服务器会在日志文件中添加一个条目，来描述已执行的事务

3.总结IO模型和零复制技术的原理

网络IO模型分为5种：阻塞型 I/O 模型，非阻塞型 I/O 模型，I/O多路复用型，信号驱动型 I/O 模型，异步 I/O 模型

阻塞型 I/O 模型（傻等）：阻塞IO模型是最简单的I/O模型，用户线程在内核进行IO操作时全程阻塞
优点：程序简单，在阻塞等待数据期间进程/线程挂起，基本不会占用 CPU 资源
缺点：并发访问量大时，内存、线程切换开销较大，资源消耗大

非阻塞型 I/O 模型（不断询问）：用户线程发起IO请求时立即返回，但没有读取到任何数据，用户线程需要不断地发起IO请求，直到数据到达后，才真正读取到数据，即"轮询"模式
缺点：轮询polling，用户线程不断发起IO请求，这么做往往会耗费大量CPU时间，实际使用很少

I/O 多路复用型（半自动一对多）：利用操作系统提供的一种机制，调用了内核中的SELECT,POLL或EPOLL作为代理，同时监控多个I/O事件（如可读、可写、异常等），select/poll/epoll这个function会不断的轮询所负责的所有socket，当某个socket有数据到达了，就通知用户进程进行处理。
优点：可以基于一个阻塞对象，同时在多个描述符上等待就绪，而不是使用多个线程，这样可以大大节省系统资源
缺点：当连接数较少时效率相比多线程+阻塞 I/O 模型效率较低，可能延迟更大，因为单个连接处理需要 2 次系统调用

信号驱动型 I/O 模型（半自动）：进程向系统调用内核获得数据，通过让内核在数据就绪时，发送信号通知进程进行数据处理
优点：线程并没有在等待数据时被阻塞，内核直接返回调用接收信号，不影响进程继续处理其他请求因此可以提高资源的利用率
缺点：信号 I/O 在大量 IO 操作时可能会因为信号队列溢出导致没法通知

异步 I/O 模型（全自动）：异步I/O是由内核通知用户进程I/O操作何时完成，在数据从内核拷贝到用户空间阶段完成后，内核直接通知用户线程可以进行后续操作，用户进程全程无阻塞
优点：异步 I/O 能够充分利用 DMA 特性，让 I/O 操作与计算重叠
缺点：技术不太完善

零复制的技术原理：数据从磁盘 —> 内核—>用户空间—>接口—>网络，尽量减少数据拷贝的次数，以缓解CPU负载
主要分为：MMAP内存映射文件（ Memory Mapping ）和 SENDFILE 两种

MMAP：数据从磁盘拷贝到内核缓存后通过MMAP Shared映射到用户空间，直接将数据拷贝到接口缓存中再到网络，减少拷贝次数

SENDFILE：数据从磁盘拷贝到内核缓存后，直接将数据拷贝到接口缓存中再到网络，绕过了用户空间，同时减少拷贝次数