什么是HTTP?(HyperText Transfer Protocol:超文本传输协议)
- 互联网内的所有计算机通信都得遵守互联网协议,才能正常通信
- 互联网协议一般细分5层,http协议就是其中的应用层众多协议中的一种
- 简单来说:HTTP就是规范浏览器(客户端)与服务器(服务端)之间的通信协议
输入网址+回车,经过了哪些过程?
1.DNS解析
DNS解析的过程就是根据域名查找 IP 地址。
2.TCP连接
浏览器根据 IP 地址向服务器发起 TCP 连接,与浏览器建立 TCP 三次握手:
(1)主机向服务器发送一个建立连接的请求(您好,我想认识您);
(1)服务器接到请求后发送同意连接的信号(好的,很高兴认识您);
(1)主机接到同意连接的信号后,再次向服务器发送了确认信号(我也很高兴认识您),自此,主机与服务器两者建立了连接。
3.发送HTTP请求
HTTP请求报文是由三部分组成: 请求行, 请求报头和请求正文。
4.服务器处理请求并返回HTTP报文
HTTP响应报文也是由三部分组成: 状态码, 响应报头和响应报文。
5.浏览器解析渲染页面
浏览器是一个边解析边渲染的过程。首先浏览器解析HTML文件构建DOM树,然后解析CSS文件构建渲染树,等到渲染树构建完成后,浏览器开始布局渲染树并将其绘制到屏幕上。
6.关闭TCP连接或继续保持连接
通过四次挥手关闭连接。一端断开连接需要两次挥手(请求和回应),两端断开连接就需要四次挥手。
网址的组成
- 协议+域名+路径+查询参数+锚点=网址
举颗栗子https://www.baidu.com/s?wd=hello&rsv_spt=1#5
https:// 这是协议
www.baidu.com这是域名
/s 这是路径
?wd=hello&rsv_spt=1这是查询参数
#5这是锚点
请求报文
GET / HTTP/1.1 //获取根目录内容(因为没写路径,默认根目录);使用http协议;使用http1.1版本
Host: www.baidu.com //访问百度这个网站的域名
User-Agent: curl/7.54.0 //我用的CURL软件;发起当前六句话请求
Accept: */* //我接受你返回的任何内容
Frank: xxx //随便加的,测试用,证明我可以加东西而已
请求的格式
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
- 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
第三部分永远都是一个回车(\n) - 第三部分回车,就是用来区分第二和第四部分的
- 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
- 这里的路径包括「查询参数」,但不包括「锚点」//因为锚点#是浏览器看的,服务器不看锚点
- 如果你没有写路径,那么路径默认为 /
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
示例3执行命令行:curl -X POST -d "1234567890" -s -v -H "Frank: xxx" -- "https://www.baidu.com"
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.54.0
Accept: */*
Frank: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded
1234567890
// 这时候你会发现,又多出了一些东西,多了四行东西,其中content-length顾名思义是上传的长度;
//content-type是上传的格式;空行就是空行;
//1234567890这是你上传的具体内容,也就是字串
响应的格式
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: Keep-Alive
Content-Length: 2443
Content-Type: text/html
Date: Tue, 10 Oct 2017 09:14:05 GMT
Etag: "5886041d-98b"
Last-Modified: Mon, 23 Jan 2017 13:24:45 GMT
Pragma: no-cache
Server: bfe/1.0.8.18
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<!DOCTYPE html>
<!--STATUS OK--><html> <head> 后面太长,省略了……
HTTP/1.1 302 Found
Connection: Keep-Alive
Content-Length: 17931
Content-Type: text/html
Date: Tue, 10 Oct 2017 09:19:47 GMT
Etag: "54d9749e-460b"
Server: bfe/1.0.8.18
<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8"> 后面太长,省略了……
状态码要背,是服务器对浏览器说的话
1xx 不常用
2xx 表示成功
3xx 表示滚吧
4xx 表示你丫错了
5xx 表示好吧,我错了
状态解释没什么用
第 2 部分中的 Content-Type 标注了第 4 部分的格式
第 2 部分中的 Content-Type 遵循 MIME 规范
HTTP 协议的底层其实是由 TCP 协议和 IP 协议(简称 TCP/IP)构建的。TCP 传输控制协议(Transmission Control Protocol)
//http规定了请求和响应四部分如何写,但是没有规定怎么传输,TCP就是来管传输的
TCP 和 UDP 的区别是什么
//TCP 可靠(我发的请求成功与否,我是知道的/就像我们访问谷歌首页,成功正常显示首页,不成功会显示具体错误的页面)、面向连接(传输的时候需要建立起两头连接)、相对 UDP 较慢;UDP 不可靠(发送一个请求,成功与否是不知道的),不面向连接(传输不需要建立连接)、相对 TCP 较快。搞定。-
TCP 的三次握手指的是什么
//每次建立连接前,客户端和服务端之前都要先进行三次对话才开始正式传输内容,三次对话大概是这样的:1\. 客户端:我要连接你了,可以吗 2\. 服务端:嗯,我准备好了,连接我吧 3\. 客户端:那我连接你咯。 4\. 开始后面步骤
如果你想更了解 TCP 可以看 此文,也可以买一本《TCP/IP 详解(卷一)》(共三卷,先只买一卷即可)。强调一遍,这不是前端的内容,只需稍微了解一下 TCP 即可。
IP 网络协议(英语:Internet Protocol)
只要你在互联网中,那么你就会有一个 IP。通俗上理解,IP 分为「内网 IP」 和「外网 IP」
- 你从电信那里买来带宽,一年一千多。
- 电信为你提供 DNS 服务。
- 你买了一个路由器,然后用电脑和手机分别连接路由器广播出来的无线 WIFI。
- 只要路由器连上电信的服务器,那么路由器就会有一个「外网 IP」,比如「14.17.32.211」就是一个外网 IP。这就是你在互联网中的地址。
- 但是如果你重启路由器,那么你很有「可能」被重新分配一个「外网 IP」,也就是说 你的路由器没有「固定的外网 IP」
- 你可以花每年几千块钱租用一个「固定的外网 IP」,但是显然不会这么浪费钱。像腾讯、阿里这样的大公司租用了很多外网 IP,这样才能对我们提供稳定的服务。
- 但是有个问题,你的路由器的外网 IP 如果是14.17.32.211,那么你的手机和电脑的 IP 又是什么呢?答案是「内网 IP」
- 路由器会在你家里创建一个内网,内网中的设备使用内网 IP,一般来说这个 IP 的格式都是 192.168.xxx.xxx。
- 一般路由会给自己分配一个好记的内网 IP,如 192.168.1.1
- 然后路由会给每一个内网中的设备分配一个不同的内网 IP,如电脑是 192.168.1.2,手机是 192.168.1.3,以此类推。
- 现在路由器有两个 IP,一个外网 IP(14.17.32.211)和一个内网 IP(192.168.1.1)
- 内网中的设备可以互相访问(比如你可以用电脑或手机进入 http://192.168.1.1 来查看你的路由器),但是不能直接访问外网,内网设备想要访问外网,就必须经过路由器中转。
- 外网中的设备可以互相访问(比如 qq.com 可以把首页发送给你的路由器,你的路由器有外网 IP),但是外网中的设备无法访问你的内网设备(这很好理解,内网是一个封闭的网络,外人进不来,所以实际上 qq.com 无法直接把首页放送给你的电脑和手机)
- 问题来了,那 qq.com 是怎么把首页发送到我的手机上的呢?答案是通过路由器来中转。
- 路由器接收到 qq.com 的页面后,把页面发送给你的电脑或手机。路由器知道如何给这些信息指路,路由器就是一个指路人,这就是「路由」两个字的来历。
- 路,就是「必由之路」中的路。由,就是「必由之路」中的由(由是经过、缘由的意思)。所有的信息都要经过路由器,然后被指向一条它该去的路。
- 也就是说内网和外网就像两个隔绝的空间,无法互通,唯一的联通点就是路由器(因为路由器既有外网 IP 也有内网 IP),所以路由器有时候也被叫做「网关」,这个「关」是「一夫当关,万夫莫开」的「关」。如果路由器到电信的连接中断了,那么内网中所有的设备也就无法上网了。(这很好理解,相当于唯一一条出去的路断了)
- 除了内网 IP 和外网 IP,还有两个特别特殊的 IP,就是本地 IP:127.0.0.1。本地 IP 永远表示设备自己。不信你可以 ping 127.0.0.1 一下,会发现只需要 0.01 ms 就得到了响应(你 ping qq.com 需要几十毫秒才得到响应)
- 默认情况下,hosts 文件里会有一行
127.0.0.1 localhost
,意思就是 localhost 指向 127.0.0.1,所以 localhost 也表示设备自己。不信你 ping localhost 试试,会发现实际上是在 ping 127.0.0.1
- 默认情况下,hosts 文件里会有一行
- 还有一个特别特殊的 IP:0.0.0.0,它不表示任何设备。这个 IP 不同的地方含义不同,以后我们会用到,用到的时候再说意思。
端口
你想要访问一个设备(前提是你使用的是 TCP 或 UDP 协议。还记得吗,HTTP 就使用了 TCP),只指定 IP 是不够的,还必须指定端口(Port)。
端口其实就是一个编号,并不是一种硬件。
一个服务器(硬件)不一定只提供一种服务,比如一个服务器既提供 HTTP 服务,又提供 FTP 服务,还提供 SMTP 服务(邮件服务),那么只用一个 IP 是无法告诉服务器你想要使用哪种服务。
所以这里有一个重要的原则:一个端口对应一个服务。
比如
- 要提供 HTTP 服务你最好使用 80 端口(能不能使用别的端口?可以,不过不建议你违反约定)
- 要提供 HTTPS 服务你最好使用 443 端口(能不能使用别的端口?可以,不过不建议你违反约定)
- 要提供 FTP 服务你最好使用 21 端口(能不能使用别的端口?可以,不过不建议你违反约定)
问题1:我怎么知道应该使用什么端口?
维基百科 把 0 到 1023 号端口对应的服务都告诉你了,点进去看看吧。
问题2:一共由多少端口?
每个机器一共有 65535(2的16次方减1)个端口(这是协议规定的)。不过这些端口的使用由一些规定
- 0 到 1023(2的10次方减1)号端口是留给系统使用的,你只有拥有了管理员权限后,才能使用这 1024 个端口。
- 其他端口可以给普通用户使用
- 如果一个端口正在提供服务,也就是被占用了,那么就不能再使用这个端口。除非你先停掉正在占用这个端口的服务。以后你们会经常遇到这个问题。
总结
上面都是 TCP/IP 相关的知识,如果你记不住,就记住下面这句话:
使用 HTTP 协议访问另一个 IP 时,要同时提供 IP 和端口号,缺一不可。
那么问题来了
我访问 http://qq.com 时并没有提供端口号,为什么我依然可以访问
答:因为浏览器帮你加了默认端口号 80。