HTTP协议
网址的组成
网址有4部分组成
- 协议 HTTP,HTTPS(加密的HTTP协议),FTP
- 域名或者IP地址 www.baidu.com, 127.0.0.1(localhost)
- 端口号 HTTP协议的端口号是80,HTTPS端口号443
- 路由(就是路径) /,/login
百度的网址——https://www.baidu.com/
域名又是什么?
我们通过IP地址进行通信,但是IP地址又很难被人们记住所以诞生了域名。
当我们访问一个网页时,先通过DNS(Domain Name Server,域名服务器)查询到该域名所绑定的IP地址然后再进行访问。
使用ping可以得到域名所绑定的IP地址
百度 https://www.baidu.com/ 对应的IP地址是[115.239.211.112]
端口号
端口号是用来区分不同的服务,当一个数据到达计算机,然而计算机有很多软件都在接收数据如QQ、邮箱、浏览器等等。
但是不知道到底是谁的数据,有了端口号就是可以区分不同的服务。端口号范围是从0 到65535。
重头戏HTTP超文本传输协议
为什么叫超文本传输协议呢,因为收发的是文本信息。
1,浏览器(客户端)按照规定的格式发送文本数据(请求)到服务器
2,服务器解析请求,按照规定的格式返回文本数据到浏览器
3,浏览器解析得到的数据,并做相应处理
HTTP协议也有4部分组成
- 请求行或者响应行
- heard头部信息
- 两个空行\r\n\r\n主要来分割heard和body(一个\r\n等同于python中的一个\n)
- body内容也就是HTML文本(可以为空)
下面是一个完整的HTTP请求
GET / HTTP/1.1
Host: localhost:8000
Connection: keep-alive
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) Chrome/64.0.3282.167 Safari/537.36
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
Accept-Encoding: gzip, deflate, br
Accept-Language: zh-CN,zh;q=0.9
Cookie: Pycharm-62160a8f=9b13cb50-3135-4837-8ef9-6ef21178fd2f
其中响应行(第一行):
1,GET请求方式还有POST请求
2,/ 是请求网页的路径
3,HTTP/1.1 是版本
heard里面是HOST(IP地址和端口号)Cookie等一些属性
body里面是POST请求的参数
下面是一个响应的HTTP
HTTP/1.1 200 OK
Date: Thu, 29 Mar 2018 12:03:27 GMT
Content-Type: text/html
Content-Length: 14615
Last-Modified: Wed, 28 Mar 2018 11:23:00 GMT
Connection: Keep-Alive
Vary: Accept-Encoding
Set-Cookie: PSTM=1522325007; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Server: BWS/1.1
X-UA-Compatible: IE=Edge,chrome=1
Pragma: no-cache
Cache-control: no-cache
Accept-Ranges: bytes
html文本...
其中响应行(第一行):
1,HTTP/1.1 是版本
2,200 是[状态码]跟 404 一样
3,OK 是状态码的描述(404就是NOT FOUND)
浏览器会自己解析Header部分,然后将Body(html)渲染成网页
web服务器是做什么的?
Web服务器就是处理HTTP请求的
完整的套路
- 接收浏览器(客户端)发送的请求(符合HTTP协议的文本)
- 后台处理数据
- 将响应数据(一个网页)返回浏览器
- 浏览器渲染网页