http请求过程:从用户浏览器输入地址点击进入发生了什么:
首先他会请求DNS 把域名解析成对应的IP地址,然后根据IP地址在互联网上找到对应的服务器,向这个服务器发送请求,由这个服务器决定返回相应的数据给用户。
如何发起一个请求:本质就是建立socket连接
curl -I "http://item.taobao.com/item.htm?id=1264"
HTTP/1.1 301 Moved Permanently
Server: Tengine
Date: Sun, 15 Apr 2018 15:38:38 GMT
Content-Type: text/html
Content-Length: 278
Connection: keep-alive
location: https://item.taobao.com/item.htm?id=1264
Via: cache2.cn217[,0]
Timing-Allow-Origin: *
EagleId: 741f494215238067185204985e
HTTP解析
请求头 | 说明 |
---|---|
Accept-Charset | 用于指定客户端接受的字符集 |
Accept-Encoding | 用于指定可接受的内容编码,如Accept-Encoding:gzip.deflate |
Accept-Language | 用于指定一种自然语言,如:Accept-Language:zh-cn |
Host | 用于指定被请求资源的Internet主机和端口号 |
User-Agent | 客户端将它的操作系统、浏览器和其他属性告诉服务器 |
Connection | 当前连接是否保持,如:Connection:Keep-Alive |
HTTP中最重要的是要熟悉HTTP Header,它控制着用户浏览器的渲染行为和服务器的执行逻辑。
常见的HTTP请求头与响应头:
常见的HTTP请求头:
请求头 | 说明 |
---|---|
Accept-Charset | 用于指定客户端接受的字符集 |
Accept-Encoding | 用于指定可接受的内容编码,如Accept-Encoding:gzip.deflate |
Accept-Language | 用于指定一种自然语言,如:Accept-Language:zh-cn |
Host | 用于指定被请求资源的Internet主机和端口号 |
User-Agent | 客户端将它的操作系统、浏览器和其他属性告诉服务器 |
Connection | 当前连接是否保持,如:Connection:Keep-Alive |
响应头 | 说明 |
---|---|
Server | 使用的服务器名称,如Server:Apache/1.3.6(Unix) |
Content-Type | 用来指明发送给接收者的实体正文的媒体类型,如Content-Type:text/html;charset=GBK |
Content-Encoding | 与请求头Accept-Encoding对应,告诉浏览器服务端采用的是什么压缩编码 |
Content-Language | 描述了资源所用的自然语言 |
Content-Length | 指明实体正文的长度,用以字节方式存储的十进制数字来表示 |
Keep-Alive | 保持连接的时间,如Keep-Alive:timeout=5,max=120 |
常见HTTP响应头:
响应头 | 说明 |
---|---|
Server | 使用的服务器名称,如Server:Apache/1.3.6(Unix) |
Content-Type | 用来指明发送给接收者的实体正文的媒体类型,如Content-Type:text/html;charset=GBK |
Content-Encoding | 与请求头Accept-Encoding对应,告诉浏览器服务端采用的是什么压缩编码 |
Content-Language | 描述了资源所用的自然语言 |
Content-Length | 指明实体正文的长度,用以字节方式存储的十进制数字来表示 |
Keep-Alive | 保持连接的时间,如Keep-Alive:timeout=5,max=120 |
浏览器的缓存机制
出现浏览器缓存的问题,一般按Ctrl+F5组合键重新请求刷新页面。为什么重新请求的页面肯定是最新的页面?首先是在浏览器端,按组合键,浏览器会直接向目标URL发送请求,而不会使用浏览器缓存的数据;其次即使请求发送到服务器,也有可能访问到的是缓存的数据,比如应用服务器的前端部署一个缓存服务器,那么会走缓存数据。当使用组合键重新请求是,会在HTTP的请求头增加一些请求头:Cache-Control:no-cache,Pragma:no-cache
Expires: 后边长跟的是一个时间,超过这个时间,缓存的内容将失效,也就是浏览器在发出请求之前检查这个页面的这个字段,看页面是否过期,Cache-Control的优先级高于该字段,同时出现时,Cache-Control的值会覆盖Expires。