http缓存

来源: 《http权威指南》
学一个东西,怎么去学习呢?
这分为三个步骤,是什么, 为什么, 怎么做?文章我会着重讲怎么做。

缓存是什么?

web缓存或代理缓存是一种特殊的http代理服务器, 可以将经过代理传送的常用文档复制保存起来。下一个请求同一文档的客户端就可以享受缓存的私有副本所提供的服务了

缓存有啥子好处??

减少了冗余的数据传输。

这个是什么个玩意呢??
在很多客户端访问一个原始服务器页面时,服务器会多次传输同一份文档, 每次传递给一个客户端,一些相同的字节会在网络中一遍遍传输,加重web服务器的负载。。有了缓存,就可以保留第一条服务器响应的副本,后继请求就可以由缓存的副本来应付了。

缓解了网络瓶颈

很多网络为本地网络客户端提供的带宽比远程服务器提供的带宽要宽

降低了对原始服务器的要求

比如在一些爆炸性新闻的时候,就会有很多人同时去访问一个服务器,这个时候,服务器就要处理大量的请求,就可能会出现灾难性的崩溃

降低了距离时延

因为从较远的地方加载页面会更慢一些。每台网络路由器会都会增加因特网流量的时延

好的,现在要开始正式讲讲我们的缓存了,前面只是小毛皮

缓存处理步骤

1)接收——缓存从网络中读取抵达的报文
2)解析——缓存对报文进行,提取出url和各种首部
3)查询——缓存查看是否有本地副本可用,如果没有,就获取一份副本并将其保存在本地。
4)新鲜度查询——缓存查看已缓存副本是否足够新鲜,如果不是,就询问服务器是否有更新
5)创建响应——缓存会用新的首部和已缓存的主体来构建一条响应报文
6)发送——缓存通过网络将响应发回给客户端
7)日志——缓存可选地创建一个日志文件条目来描述这个事务

缓存GET请求的流程图

在这里,我们着重了解第(4)步骤
在第四步中的新鲜度查询中,我们会了解到一个文档过期的概念。

文档过期

这是通过HTTPCache-Control首部和Expires首部来完成的。这些说明了在多长时间内可以将这些内容视为新鲜的。

在缓存文档过期之前,缓存可以以任意频率使用这些副本,无需与服务器联系。这个时候会返回带有200状态码的首部,是一种强缓存的方式。当然,除了客户端请求中包含有阻止提供已缓存或未验证资源的首部。

当然,如果文档过期了呢?
这个时候就会有了服务器再验证的过程

服务器再验证
  • 内容发生了变化,缓存就会获取一份新的文档副本,包括一个新的过期时间,并将其存储在旧文档的位置上,然后将文档发送给客户端,并返回200状态码
  • 内容未发生变化,缓存就只需要获取新的首部,包括一个新的过期日期,并对缓存中的首部进行更新就可以了,返回304状态码
    那么, 如何进行验证呢?
    这里,有两种再验证方式。If-Modified-Since: <date>, If-None-Match: <tag>, 简单来说,就是, 一种是通过检测文档在指定日期之后是否被修改, 一种是通过服务器为文档提供特殊的标签,检查标签是否被修改。

If-Modified-Since (日期再验证)

这是最常见的缓存再验证首部。即检查指定时间之后,文档是否被修改

If-None-Match (实体标签再验证)

这里的实体标签是附加到文档的任意标签。可能是包含了文档的序列号或版本名,或者是文档内容的校验和其他指纹信息。
之后,服务器就根据这些实体标签是否发生变化来进行验证。

为什么会需要这种验证方式呢??
  • 在某些情况下,文档可能被修改了, 但所修改的内容并不重要,不需要让世界范围内的缓存都重装数据
  • 有些文档被周期性的重写,但实际包含的数据是一样的,尽管内容不变,但修改日期会发生变化。

控制缓存的能力

服务器可以通过HTTP定义的几种方式来制定文档过期之前可以将其缓存多久,,大部分来说就是设置Http首部Cache-Control属性。

  • Cache-Control: no-store
  • Cache-Control: no-Cache
  • Cache-Control: must-revalidate
  • Cache-Control: max-age
  • Expire日期
  • 不附加过期信息,让缓存自己确定自己的过期日期

no-store VS no-cache

no-store响应会禁止缓存对响应进行复制,缓存通常会像非缓存代理服务器一样,向客户端发送一条no-store响应, 然后删除对象
no-cache,这个响应实际上是可以存储在本地缓存区的。只是在与原始服务器进行再验证之前,缓存不能将其提供给客户端使用

max-age响应首部

Cache-Control: max-age=3600
Cache-Control: max-age=0 为0时服务器可以请求缓存不要存储文档,因此每次访问都进行刷新。

must-revalidate响应首部

可以配置缓存,使其提供一些陈旧的对象,以提高性能。
Cache-Control: must-revalidate 该响应首部告诉缓存,在事先没有跟原始服务器进行再验证的情况下,不能提供这个对象的陈旧副本。缓存仍然可以随意提供新鲜的副本。检查时如果原始服务器不可用就返回504状态码网络连接超时

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 本文内容大多参考《图解HTTP》一书 一. 认识代理服务器 所以讲缓存为什么要先扯代理服务器?别急,让我们看一下一...
    流光号船长阅读 1,958评论 0 10
  • 网络特有的延迟以及数据传输的成本,制约互联网快速获取Web资源。为此,HTTP协议引入缓存以空间换时间,使浏览器缓...
    大头8086阅读 3,086评论 2 12
  • 每个浏览器都自带了 HTTP 缓存实现功能。您只需要确保每个服务器响应都提供正确的 HTTP 标头指令,以指示浏览...
    _july77阅读 293评论 0 0
  • / 01 / 就在前几日,有新闻曝出:范冰冰双喜临门,不仅接受了李晨的求婚,而且获得了金鸡百花电影节的最佳女主角,...
    我就是道路阅读 328评论 0 0
  • 臭撒比儿啊,真稀罕你
    01348557f6f5阅读 148评论 0 1