这个问题问的真是很好,于是希望认认真真的去回答一下。当然,某些知识是百度的来,也结合了日常工作中的一些东西,希望这个回答在我前端学习一段时间再回来看的时候能够会心一笑就好。
希望体现的知识点:页面\网络\HTTP\Nginx\加密\算法
Step1.浏览器查找域名的IP地址(DNS)(忽略网络部分)
通过递归搜索方式,查找域名对应的IP地址。一般的DNS服务器中都会有.com域名的缓存。缓存刷新时间通常是10分钟。
大多数DNS服务器使用Anycast来获得高效低延迟的DNS查找。 Anycast可以自行百度百科,我并不懂,不深挖。
Step2.浏览器给Web服务器发送了一个HTTP请求
HTTP连接最显著的特点是客户端发送的每次请求都需要服务器回送响应,在请求结束后,会主动释放连接,它是一种“短连接”,要保持客户端程序的在线状态,需要不断地向服务器发起连接请求。
HTTP请求类似于:
在这里我们可以看到,HTTP请求头信息包含的信息:
Accept:
接受类型。这里显示可以接受任何类型的返回。
Accept-Encoding:
gzip,deflate. 声明浏览器可以接受的编码类型。这里可以看到,接受的编码类型为gzip和deflate,这也是常见的HTTP压缩技术。了解不深入,不继续拓展。
Accept-Language: Zh-CN,zh:q=0.8;en-US;q=0.5,en;q=0.3
浏览器可以接受的语言类型。这里可以看到分别为中文,英文。其中,q代表用户偏好程度。
Connection:keep-alive
拓展:Keep-alive.
Http1.0中,官方没有规定连接的工作方式,此时必须添加keep-alive,保持连接一直存活。从1.1开始,默认即为连接Keep-alive,此时除非声明close,否则将一直处于alive状态。
Cookie
没法细说,先略过。此处暂时理解为存储用户信息和Token的用途。
Host :www.baidu.com
主机名。没法细说。
Referer:***
告诉HTTP协议,我是从哪个页面过来的,以便于服务器进行处理。
User-Agent:***
用户使用的各种浏览器端信息。
Step3:301永久重定向+跟踪重定向地址
URL规范化需要使用。百度到的301重定向作用为,一是为了URL规范化并集中权重不让权重分散、二是为了网站改版,将旧版本的页面的所有指标全部转移到新版本的页面上。这里我了解的同样有限,不做深挖。暂时理解为有利于网站改版与SEO,继续跟踪重定向以便获得
Step4:服务器端接收到了信息
这个我个人还是以我比较熟悉的Nginx来进行说明(Apache未了解过。)简单的说,就是收到一个请求,并进行了处理。但是怎么处理的呢?网上搜了一圈,没有找到太多的回答。于是尝试自己作答一下。以下均为个人理解,不保证正确性。
我们知道,Nginx分为Master进程和Worker进程。HTTP请求是由Work进程处理的,具体步骤如下:
Worker进程调用事件模块——建立TCP连接——根据配置文件交由HTTP框架处理——接受请求的HTTP包头——根据location配置调用HTTP模块处理请求——处理请求——发送HTTP响应时一次调用所有HTTP过滤模块——根据配置文件决定如何处理(是否进行HTTP过滤),是 则进行HTTP过滤,否则直接返回。
在获取HTTP头部之后,将其存储进headers这个ngx_list_t链表,进行值判断,并进行Hash值校验。如果hash为0,则表明不是合法的头部。同时判断HTTP头部值是否为"uploadFile",如果不是,也不是正确的头部。
进行头部判断后,开始获取HTTP包体。HTTP包体的长度由于未事先声明,有可能非常大。如果试图一次性调用并全部读取完,那么肯定会阻塞该Worker进程。Nginx HTTP框架提供了一种方法来异步地接收包体,方法名为ngx_http_read_client_request_body。调用它只是说明要求Nginx开始接收请求的包体,并不表示是否已经接收完,当接收完所有包体后,post_handle指向的回调方法会被调用。换句话说,ngx_http_read_client_request_body返回时既有可能已经接收完请求中所有的包体,也有可能还没开始接收包体。结束的标志是什么呢?返回NGX_DONE.
Step5:服务器发回HTML响应
请求处理完毕后,开始发送HTTP响应,告知Client端已经处理完毕。响应主要包括响应行,响应头部,包体三部分。具体的不多说,只是要注意,返回的类型值为Text/html,通知客户端以HTML格式进行包处理。
Step6:页面渲染,开始显示
了解的不多也不懂。此处放一张图吧,来自知乎。