(1)建立连接:接收或拒绝连接请求
(2)接收请求:
接收客户端请求报文中对某资源的一次请求的过程
Web访问响应模型(Web I/O)
(1)单进程I/O模型:启动一个进程处理用户请求,而且一次只处理一个,多个请求被串行响应(如果访问量小,可以用这种)
(2)多进程I/O模型:并行启动多个进程,每个进程响应一个连接请求(缺点:进程消耗资源比较多,成本比较高,一个进程相当于建立了豪华的贵宾室,只能接受一个进程,但是稳定性比较好)
(3)复用I/O结构:启动一个进程,同时响应N个连接请求
实现方法:多线程模型和事件驱动
多线程模型:一个进程生成N个线程,每线程响应一个连接请求(相当于贵宾室开了好几个窗口,但是共用内存,稳定性不太好)
事件驱动:一个进程处理N个请求
(4)复用的多进程I/O模型:启动M个进程,每个进程响应N个连接请求,同时接收M*N个请求
(3)处理请求:
服务器对请求报文进行解析,并获取请求的资源及请求方法等相关信息,根据方法,资源,首部和可选的主体部分对请求进行处理
元数据:请求报文首部
<method> <URL> <VERSION>
HEADERS 格式 name:value
<request body>
示例:
Host: www.magedu.com 请求的主机名称
Server: Apache/2.4.7
HTTP常用请求方式,Method、GET、POST、HEAD、PUT、DELETE、TRACE、OPTIONS
一次完整的http请求处理过程
(4)访问资源:
服务器获取请求报文中请求的资源web服务器,即存放了web资源的服务器,负责向请求者提供对方请求的静态资源,或动态运行后生成的资源资源放置于本地文件系统特定的路径:DocRoot
DocRoot /var/www/html
/var/www/html/images/logo.jpg
http://www.magedu.com/images/logo.jpg
web服务器资源路径映射方式:
(a) docroot
(b) alias
(c) 虚拟主机docroot
(d) 用户家目录docroot
一次完整的http请求处理过程
(5)构建响应报文:
一旦Web服务器识别除了资源,就执行请求方法中描述
动作,并返回响应报文。响应报文中 包含有响应状态码、响应首部,如果生成了响应主体的话,还包括响应主体。
1)响应实体:如果事务处理产生了响应主体,就将内容放在响应报文中回送过去。响应报文中通常包括:
描述了响应主体MIME类型的Content-Type首部
描述了响应主体长度的Content-Length
实际报文的主体内容
2)URL重定向:web服务构建的响应并非客户端请求的资源,而是资源另外一个访问路径
永久重定向:http://www.360buy.com
临时重定向:http://www.taobao.com
一次完整的http请求处理过程
3)MIME类型:
Web服务器要负责确定响应主体的MIME类型。有很多配置服务器的方法可以将MIME类型与资源管理起来
魔法分类:Apache web服务器可以扫描每个资源的内容,并将其与一个已知模式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比较慢,但很方便,尤其是文件没有标准扩展名的时候
显式分类:可以对Web服务器进行配置,使其不考虑文件的扩展名或内容,强制特定文件或目录内容拥有某个MIME类型类型协商: 有些Web服务器经过配置,可以以多种文档格式来存储资源。在这种情况下,可以配置Web服务器,使其可以通过与用户的协商来决定使用哪种格式(及相关的MIME类型)"最好"
(6)发送响应报文
Web服务器通过连接发送数据时也会面临与接收数据一
样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据。服务器要记录连接的状态,还要特别注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭自己这一端的连接。对持久连接来说,连接可能仍保持打开状态,在这种情况下,服务器要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束了
(7)记录日志
最后,当事务结束时,Web服务器会在日志文件中添加
一个条目,来描述已执行的事务
套接字由IP地址和端口号组成