前言:在浏览器中输入https://www.baidu.com/按下回车键,到百度首页出现,这个过程发生了些什么呢?
一、先了解什么是URL和IP地址
URL正式名称为 Uniform Resource Locator (简称:URL),是统一资源定位符,用于定位互联网上的资源。如https://www.baidu.com/就是URL。URL包含多种协议,比较常见的有http,https,ftp,file。
http是超文本传输协议,是用于从WWW服务器传输超文本到本地浏览器的传输协议。
https是加密版超文本传输协定,传输的网页经过加密,信息内容不容易被破解。所以https比http协议更加安全,也更加常见。
ftp是文件传输协议,主要用于在本地主机和远程主机之间传送文件,需要对不同的用户设置不同的权限,一般用于局域网的文件传输。
file是本地文件传输协议,主要用于访问本地计算机中的文件。
url的格式一般为:协议类型://<主机名>:<端口>/<路径>/文件名,以https://www.baidu.com/为例。
- https表示该网站服务器使用https协议。
- 主机名是否输入没有影响,端口号没有输入则表示为默认端口号,默认情况下http服务的端口为80。ftp为21,https为443。
- 百度的域名则是www.baidu.com,百度的URL以斜杠“/”结尾,而没有给出文件名,在这种情况下,URL引用路径中最后一个目录中的默认文件(通常对应于主页),这个文件常常被称为 index.html 或 default.htm。所以输入这个网址实际是进入该网站的主页。
IP是互联网中的每台连接到网络的计算机为实现相互通信而遵循的规则协议。每个处于互联网中的设备都有IP 地址,形如 192.168.0.1,而127.0.0.1代表本机的 IP。IP又分为局域网IP和公网IP。而局域网 IP 和公网 IP 是有差别的。每个网站就是靠IP来定位的。
那为什么不直接用IP来访问网站,而发明域名呢?
- IP地址为一串数字,一个网站对应一串数字,当访问多个网站时,需要记忆多个IP地址,不方便记忆。
- 域名有语义化的作用,它比IP地址更容易记忆。
二、域名解析
以https://www.baidu.com/为例,浏览器实际是不知道https://www.baidu.com/到底是在互联网的哪个位置,它需要查找https://www.baidu.com/这个域名背后对应的 IP 地址,根据这个IP地址,访问网站。查找域名对应的IP地址的过程叫域名解析。
域名解析流程
- 浏览器缓存
如果浏览器曾经访问过该网站,浏览器会缓存DNS记录一段时间,这样就快速找到该网站对应的 IP 地址,则域名解析结束。如果没有找到,会继续进行域名解析。
- 系统缓存
从电脑系统中 Hosts 的文件查找该域名和对应的IP地址。如果没有找到,继续进行域名解析。
- 路由器缓存
如果连着同一个路由器的其他设备访问过该网站,路由器也会缓存域名信息。从该路由器的缓存中查找是否有该网站对应的 IP 地址。如果没有,域名解析继续。
- ISP DNS 缓存
以上还是没有,就会向网络供应商 ( ISP) 查找是否有该网站对应的 IP 地址。如果没有,域名解析继续。
- 查找根域名伺服器供应商
若都没有找到,则向根域名服务器查找域名对应 IP,根域名服务器把请求转发到下一级,直到找到对应IP。
三、服务器处理
服务器是一台安装系统的机器,常见的系统有Linux,Windows server 2012。每台服务器上都会安装处理请求的应用——web server。常见的web server 有“apache”,“nginx”,“IIS”、“Lighttpd”等。Web服务器接收用户的请求(requset)交给网站代码或反向代理到其他服务器,然后进行一个网站处理流程,最后产生一个html的响应(response)给浏览器。
网站处理流程
网站处理是实际后台处理。后台开发到现在有很多框架,但大部分都还是按照“MVC设计模式”进行搭建的。
MVC是一个设计模式,将应用程序分成三个核心部件:模型(model),视图(view),控制器(controller)
MVC的处理过程
每一个用户输入的请求
首先被路由接收,再交由控制器决定用哪个模型来进行处理
将用户输入的指令数据传给模型进行处理
进行业务逻辑判断,按需要向数据库进行存取
根据业务逻辑选择视图
控制器用业务逻辑相应的数据填入视图模型
将处理好的视图模版的HTML交回控制器
生成 HTML 字符串返给浏览器处理,并通过显示页面呈现给用户。
四、浏览器处理
浏览器处理是根据MVC模型处理返回的HTML字符串被浏览器接受后被一句句读取解析,当解析到link标签后重新发送请求获取CSS 。当解析到scrip标签后发送请求获取JS,并执行代码。当解析到img标签后发送请求获取图片资源。
浏览器是一个边解析边渲染的过程。首先浏览器解析HTML文件构建DOM树,然后解析CSS文件构建渲染树,等到渲染树构建完成后,浏览器开始布局渲染树并将其绘制到屏幕上。