web缓存可以分为:浏览器缓存、服务器缓存、数据库数据缓存。因为可能会直接使用副本免于重新发送请求或者仅仅确认资源没变无需重新传输资源实体,web缓存可以减少延迟网页打开速度、重复利用资源减少网络带宽消耗、降低请求次数或者减少传输内容从来减轻服务器的压力。
一般和前端密切相关的是浏览器HTTP缓存机制。浏览器HTTP缓存可以分为强缓存和协商缓存。强缓存和协商缓存的根本区别是:强缓存命中的话不会发请求到服务器,协商缓存无论命中都一定会发请求到服务器。通过资源的请求首部字段来验证是否命中协商缓存,如果协商缓存命中,服务器会将这个请求返回,但是不会返回这个资源的实体,而是通知客户端可以从缓存中加载这个资源。
浏览器HTTP缓存由HTTP首部字段决定。
控制强缓存的字段按优先级介绍:
1.Pragma
优先级最高,当该字段值为“no-cache”的时候,会通知客户端不要对该资源缓存,即每次都得向服务器发送一次请求才行,这样是一定不会命中强缓存的。
<meta http-equiv="Pragma" content="no-cache">
事实上这种禁用缓存的形式用处很有限:
- 仅有IE才能识别这段meta标签含义,其它主流浏览器仅能识别“Cache-Control: no-store”的meta标签
- 在IE中识别到该meta标签含义,并不一定会在请求字段加上Pragma,但的确会让当前页面每次都发送新请求
这是HTTP/1.1之前版本遗留的通用首部字段,仅作为于HTTP/1.0的向后兼容而使用。
2.Cache-Control
是一个通用首部字段,也是HTTP/1.1控制浏览器缓存的主流字段。和浏览器缓存相关的是如下几个响应指令。
- private(无)
响应只能被单个用户缓存,不能作为共享缓存(即代理服务器不能缓存它)
响应只作为私有的缓存,不能被CDN等缓存,如果要求HTTP认证,响应会自动设置为private - public(可忽略)
表明响应可以被浏览器、CDN等等缓存
响应可以被任何对象(发送请求的客户端,代理服务器)缓存 - no-cache(可忽略)
缓存前必须确认其有效性
表示请求必须先于服务器确认缓存的有效性,如果有效才能使用缓存(协商缓存),无论是响应报文首部还是请求报文首部出现这个字段均一定不会命中强缓存。Chrome硬性重新加载时会在请求的首部加上Pragma:no-cache和Cache-Control:no-cache - no-store(无)
不缓存请求或响应的任何内容
表示禁止浏览器以及中间缓存存储任何版本的返回响应,一定不会出现强缓存和协商缓存,适合个人隐私数据或者经济类数据。 - max-age(必需)
响应的最大值,单位为s,设置缓存的存在时间,相对于发送请求的时间,只有响应报文首部设置Cache-Control为非0的max-age或者设置了大于请求日期的Expires才有可能命中强缓存。
当满足这个条件,同时响应报文首部中Cache-Control不存在no-cache、no-store且请求报文首部不存在Pragma字段,才会真正命中强缓存。
3.Expires
Expires 是一个响应首部字段,它制定了一个日期/时间,在这个时间/日期之前,HTTP缓存被认为是有效的。无效的日期比如0,表示这个资源已经过期了,如果同时设置了Cache-Control响应首部字段的max-age,则Expires会被忽略,它也是HTTP/1.1之前版本遗留的通用首部字段,仅作为HTTP/1.0的向后兼容而使用。
控制协商缓存的字段
1.Last-Modified / If-Modified-Since
If-Modified-Since是一个请求首部字段,并且只能用GET/HEAD请求。Last-Modified是一个响应首部字段,包含服务器认定的资源作出修改的日期及时间。当带着If-Modified-Since头访问服务器请求资源时,服务器会检查Last-Modified,如果Last-Modified的时间早于或等于If-Modified-Since,则会返回一个不带主体的304响应,否则将重新返回资源。
2.ETag/If-None-Match
ETag是一个响应首部字段,它是根据实体内容生成的一段hash字符串,标识资源的状态,由服务端产生。
If-None-Match是一个条件式的请求首部。如果请求资源时在请求首部加上这个字段,值为之前服务器返回的资源上的ETag,则当且仅当服务器上没有任何资源的ETag属性值与这个首部中列出的时候,服务器才会返回带有所请求资源实体的200响应,否则服务器会返回不带实体的304响应。
ETag优先级比If-None-Match高,同时存在会以ETag为准。
因为ETag的特性,所以相较于Last-Modified有一些优势:
- 某些情况下服务器无法获取资源的最后修改时间
- 资源的最后修改时间变了但是内容没变,使用ETag可以正确缓存
- 如果资源修改非常频繁,在秒一下的时间进行修改,Last-Modified只能精确到秒
304状态码:如果客户端发送了一个带条件的GET请求且该请求已被允许,而文档的内容并没有改变,则服务器应当返回这个304状态码。
302和301都是重定向,301是永久重定向,302是临时重定向。301比较常用的场景是使用域名跳转。302用来做临时跳转,比如未登录的用户访问用户中心重定向到登陆页面。
301和302的区别:302重定向只是暂时的重定向,搜索引擎会抓取新的内容而保留旧的地址,因为服务器返回302,所以搜索引擎认为新的网址是暂时的。
而301重定向是永久的重定向,搜索引擎在抓取新的内容的同时也将旧的网址替换成了重定向后的网址。