nginx源码阅读(一).综述
置顶 2017年10月28日 09:33:43 UKey_ 阅读数:3868 标签: nginx源码阅读web服务器简介 更多
个人分类: Nginx
所属专栏: Nginx源码阅读
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Move_now/article/details/78373017
前言
nginx作为一款开源的轻量级高性能web服务器,是非常值得立志从事服务端开发方向的人学习的。现今nginx的最新版本是nginx-1.13.6,代码量也日渐庞大,但是由于其核心思想并没改变,为了降低阅读难度,我选择的是nginx-1.0.15版本,并且由于时间和水平有限,重点关注的是nginx的启动以及进程模型、事件模块中的epoll模块、负载均衡以及整体的框架等方面。
这里先推荐两本有关nginx的书籍:《深入理解Nginx》、《深入剖析Nginx》,后者已经绝版了,可以去网上找pdf阅读。
不过建议主要还是以代码为主,书籍为辅。
下面简单的介绍一下后面会进行分析的各块。
nginx的启动
nginx整个启动流程围绕着ngx_cycle_t结构体进行操作。要知道nginx是高度模块化以及非常依赖配置文件,大部分功能都需要配置文件的配置才能进行。在启动工作中,需要做的主要工作就是读取配置文件,然后将各模块感兴趣的配置项保存到各结构体中,根据配置文件对所有的模块进行初始化,接着启动各进程,准备进行工作。
nginx的多进程模型
另一款比较常用的web服务器就是apache,它最大的特点就是稳定,所以相比于nginx复杂很多也臃肿很多。nginx最大的特点就是强调性能,在后面展示其源码时也可以看到它为了追求性能所做的一些工作。
nginx之所以高效的主要原因是它采用的异步非阻塞多进程模型,并且一般进程的个数与cpu核心数相同,一个master进程,多个worker进程,可能还会有cache loader以及cache manager进程,多个连接对应一个worker进程,master进程主要负责管理worker进程以及启动/停止服务、重新读取配置文件、平滑升级等功能,而cache进程则当开启了缓存功能才会出现。
apache则通常采用同步多进程模型,每个连接对应一个进程,apache采用的这种模型,当请求较多时,进程也随之变多,cpu资源耗费在进程间切换非常昂贵(毕竟要切换进程的上下文以及重载缓存等),而nginx因为进程数固定且很少,并且由于cpu是多核心的,可以同时运行多个不同的进程/线程,每个进程的资源都互相独立,因此切换时无需进行上下文的切换。那么为什么不采用多线程结构呢,不是说线程间的切换比进程间的切换更迅速吗,若cpu是单核的的确如此,但是当每个cpu核心运行一个线程的时候,由于线程间需要共享资源,所以这些资源必须从一个核心拷贝到另外一个核心,反观多进程就不需要。因此在cpu为多核的情况下,多线程在性能上反而可能不如多进程。
关于同步和异步的区别,可以简单的理解为,采用同步模型,cpu会阻塞等待请求的完成,而异步非阻塞时,cpu不会阻塞等待,内核处理完之后再进行通知。
nginx的事件模块
nginx采用的是事件驱动机制来处理事件,不同的模块有各自己负责处理的事件,当一个事件发生时,相应的模块就会对该事件进行处理。对于一个web服务器来说,用户的请求其实就对应了一个tcp连接,也对应了读/写事件,nginx内部使用了连接池、内存池等机制提高效率,而nginx的事件模块中针对不同的I/O多路机制select、epoll、kqueue、eventport也编写了不同的模块,这是为了能让nginx在更多的操作系统上运行。在linux下,我们重点关注的就是epoll对应的模块,nginx对epoll提供的接口进行了封装,并且将定时事件也集成到了其中。
负载均衡
nginx有两处地方进行了负载均衡。一处是当大量的请求到来时,各个worker进程该如何分配这些请求,而不会造成其中某个worker进程超载,而另外的worker进程则空闲,nginx采用的是负载均衡锁,当一个worker进程处理的连接数大于某个值时,就不再接受新的连接。
还有一处是当nginx作为反向代理服务器运行时,会将客户端的请求转发给上游服务器,若上游服务器有多个,则需要选择将请求转发给哪个上游服务器,一直转给一个造成其中某个服务器过载,但是其余空闲肯定是不对。nginx官方提供了加权轮询、IP哈希这两种负载均衡的方法。加权轮询简单的来说就是计算各个上游服务器的权值,然后选择权值最高的服务器处理请求;IP哈希负载均衡策略则会使用客户端的ip地址作为哈希的key来决定选择服务器群中某台服务器来处理客户端的请求,这种方式可以确保来自同一台客户端的请求会分发到同一台服务器上,除非这台服务器处于不可用状态。
除了这两种方法之外,还有一致哈希、fair等方法,不过都是第三方模块。
整体架构
nginx即可以处理静态请求也可以处理动态请求,并且还可以作为反向代理服务器。但是它处理动态请求的效果并不如apache好,因此一般作为静态web服务器和反向代理服务器。整体的架构引用《深入剖析Nginx》书中的图:
小结
本小节简单的介绍了一下后面要展开分析的各块,接下来正式开始分析nginx的启动流程。