简介
HTTP是的数据通信的基础。设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。想象一个场景,当两个电脑进行通信的时候(发送请求和响应请求),如果两个都用自己的方式去理解对方,这不就乱套了么?所以需要一个规则来规定他们通信时候每句话、符号、数字所表示的意义是什么。这就是HTTP的由来,这就像玩破冰游戏时候一开始裁判所说的规则一样,只是HTTP这个规则比较长而已。
命令行
说到HTTP,就离不开发送请求。当我们每次在浏览器访问网站的时候,其实就在发请求:输入www.baidu.com的时候发的是GET请求,点击登录的时候发的是POST请求等等。浏览器不过是可以将返回的页面解析并显示出来,而这些请求都是特定的请求,如果想发特定的呢?比如我就想发一个123给www.baidu.com呢?这个时候就可以用命令行去完成了。
上手
$ curl -- "https://www.baidu.com"
你会看到输出的是一堆HTML,这就是最简单的对百度网页的GET请求。
查看详细的Request和Response
单单看返回的HTML内容没什么意义,我们其实想更深入地去看我们到底发了什么给百度,这里的 -v 是指 verbose ,就是啰嗦地给你说整个 request 和 response 的内容
$ curl -v -- "https://www.baidu.com"
你会看到如下内容
* Rebuilt URL to: www.baidu.com/
* Trying 104.193.88.123...
* TCP_NODELAY set
* Connected to www.baidu.com (104.193.88.123) port 80 (#0)
> GET / HTTP/1.1
> Host: www.baidu.com
> User-Agent: curl/7.54.0
> Accept: */*
>
< HTTP/1.1 200 OK
< Accept-Ranges: bytes
< Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
< Connection: Keep-Alive
< Content-Length: 2381
< Content-Type: text/html
< Date: Sat, 13 Oct 2018 03:25:42 GMT
< Etag: "588604eb-94d"
< Last-Modified: Mon, 23 Jan 2017 13:28:11 GMT
< Pragma: no-cache
< Server: bfe/1.0.8.18
< Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<
解释一下
- 星号 * 开头的是注释,可以不看
- 大于号 > 是你的请求内容
- 小于号 < 是对方对你请求的响应内容
- 后面是响应内容,这里就不展示出来了
发送其他请求
接着我们来试试发送一个POST请求,这里的 -X 是指 request,读一下request的英文是不是有点X的音?
$ curl -X POST -v -- "https://www.baidu.com"
按下回车后,看到了和之前不一样的响应内容,内容里所说的就是找不到网址。如果想给网站加一些POST的数据可以这么写,这里的是 -d 是指 data,就是要发送的数据
$ curl -X POST -v -d "12345" -- "www.baidu.com"
注意看请求的Content-Type属性
> Content-Length: 5 -> 就是我们的"12345"
Header
当我们发送一个请求的时候,有时候要告诉对方一些有用的信息,比如我拿什么软件给你发的、发多少东西给对方等,这些东西一般写在请求头里。就像我们给别人送信一样,请求头就是我们的信封。
可以在命令中加入 -H "xxx: yyy" 到请求头中,注意:加入请求头的内容必需是 key: value 的形式
curl -X POST -v -H "xxx: yyy" -- "www.baidu.com"
再看我们发送请求的请求头,会在最后多了一行
> xxx: yyy
请求格式
玩了上面的命令,可能你都大概了解了HTTP的套路了,下面先对HTTP请求的套路总结一下
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.54.0
3
4 要上传的数据
- 首先请求至少包含三部分(如果要发送数据,数据就是第四部分)
- 第一部分包括了用什么方法(动词)用什么版本(版本)的什么协议(协议)向谁(路径)发送的请求
- 第二部分包括了这封信(请求)的信封上面的内容(请求头)
- 第三部分是一个回车换行符,用来分割第二部分和第四部分
- 第四部分是发送的数据
注意
- 这里的路径包括「查询参数」,但不包括「锚点」
- 可用的请求方法有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
- 如果你没有写路径,那么路径默认为 /
- 第二部分中的 Content-Type 标注了第 4 部分的格式
响应格式
下面说下响应的格式
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
- 第一部分首先说明我用什么版本(版本)的什么协议(协议)给你发送一个接收状态,状态码都有对应的解释,后面的状态解释算是一个详细的说明
- 第二部分包括了响应的信息,但是不是主要内容,只是此次响应的基本信息
- 第三部分也是一个回车换行符,用来分割第二部分和第四部分
- 第四部分才是响应的内容,一般为JSON数据或者HTML页面
用Chrome来查看网络请求
如果你觉得用命令行看请求太费劲,可以用Chrome来查看请求和响应的内容,用GUI看毕竟清析一点。
- 首先右键点击审查
- 打开 Network
- 输入网址
- 选中第一个响应
- 查看 Response Headers,点击「view source」
- 你会看到响应的前两部分
- 查看 Response 或者 Preview,你会看到响应的第 4 部分