1.编写一个playbook实现Nginx的两种安装过程,安装方式可通过变量传入控制
包安装nginx:
编译安装nginx
2.总结http协议版本和工作原理
http/1.0 :支持cache, MIME, method,每次传输数据时,每次都需要新建立连接
http/1.1 :引入了持久连接(persistent connection),减少了建立和关闭连接的消耗和延迟
http/2.0 :复用TCP连接,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,且不用按顺序响应
工作原理:
一次http事务包括:http请求和http响应。首先客户端发起http请求建立连接(接收或拒绝连接请求),服务端接收请求(接收客户端请求报文中对某资源的一次请求的过程),处理请求(服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息),访问资源(服务器获取请求报文中请求的资源web服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源),构建响应报文(一旦Web服务器识别除了资源,就执行请求方法中描述的动作,并返回响应报文)然后发送响应报文,最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描述已执行的事务
3.总结IO模型和零复制技术的原理
网络IO模型分为5种:阻塞型 I/O 模型,非阻塞型 I/O 模型,I/O多路复用型,信号驱动型 I/O 模型,异步 I/O 模型
阻塞型 I/O 模型(傻等):阻塞IO模型是最简单的I/O模型,用户线程在内核进行IO操作时全程阻塞
优点:程序简单,在阻塞等待数据期间进程/线程挂起,基本不会占用 CPU 资源
缺点:并发访问量大时,内存、线程切换开销较大,资源消耗大
非阻塞型 I/O 模型(不断询问):用户线程发起IO请求时立即返回,但没有读取到任何数据,用户线程需要不断地发起IO请求,直到数据到达后,才真正读取到数据,即"轮询"模式
缺点:轮询polling,用户线程不断发起IO请求,这么做往往会耗费大量CPU时间,实际使用很少
I/O 多路复用型(半自动一对多):利用操作系统提供的一种机制,调用了内核中的SELECT,POLL或EPOLL作为代理,同时监控多个I/O事件(如可读、可写、异常等),select/poll/epoll这个function会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程进行处理。
优点:可以基于一个阻塞对象,同时在多个描述符上等待就绪,而不是使用多个线程,这样可以大大节省系统资源
缺点:当连接数较少时效率相比多线程+阻塞 I/O 模型效率较低,可能延迟更大,因为单个连接处理需要 2 次系统调用
信号驱动型 I/O 模型(半自动):进程向系统调用内核获得数据,通过让内核在数据就绪时,发送信号通知进程进行数据处理
优点:线程并没有在等待数据时被阻塞,内核直接返回调用接收信号,不影响进程继续处理其他请求因此可以提高资源的利用率
缺点:信号 I/O 在大量 IO 操作时可能会因为信号队列溢出导致没法通知
异步 I/O 模型(全自动):异步I/O是由内核通知用户进程I/O操作何时完成,在数据从内核拷贝到用户空间阶段完成后,内核直接通知用户线程可以进行后续操作,用户进程全程无阻塞
优点:异步 I/O 能够充分利用 DMA 特性,让 I/O 操作与计算重叠
缺点:技术不太完善
零复制的技术原理:数据从磁盘 —> 内核—>用户空间—>接口—>网络,尽量减少数据拷贝的次数,以缓解CPU负载
主要分为:MMAP内存映射文件( Memory Mapping )和 SENDFILE 两种
MMAP:数据从磁盘拷贝到内核缓存后通过MMAP Shared映射到用户空间,直接将数据拷贝到接口缓存中再到网络,减少拷贝次数
SENDFILE:数据从磁盘拷贝到内核缓存后,直接将数据拷贝到接口缓存中再到网络,绕过了用户空间,同时减少拷贝次数