浏览器缓存
缓存位置:
Service Worker:
1.Service Worker 是运行在浏览器背后的独立线程,一般可以用来实现缓存功能
2.传输协议必须为 HTTPS,因为 Service Worker 中涉及到请求拦截
3.Service Worker自由控制缓存哪些文件、如何匹配缓存、如何读取缓存,并且缓存是持续性的
Memory Cache:
1.Memory Cache是内存中的缓存,主要包含的是当前中页面中已经抓取到的资源,例如页面上已经下载的样式、脚本、图片
等
2.读取内存中的数据肯定比磁盘快,但缓存持续性很短,会随着进程的释放而释放。
3.让数据都存放在内存中不可能,计算机中的内存一定比硬盘容量小得多
Disk Cache:
1.Disk Cache 也就是存储在硬盘中的缓存,读取速度慢点,但是什么都能存储到磁盘中
2.对于大文件来说,大概率是不存储在内存中的,反之优先
3.当前系统内存使用率高的话,文件优先存储进硬盘
Push Cache
1.Push Cache(推送缓存)是 HTTP/2 中的内容,当以上三种缓存都没有命中时,它才会被使用。
2.它只在会话(Session)中存在,一旦会话结束就被释放,并且缓存时间也很短暂,在Chrome浏览器中只有5分钟左右
缓存策略:
强缓存:
1.不会向服务器发送请求,直接从缓存中读取资源
2.在chrome控制台的Network选项中可以看到该请求返回200的状态码,
3.Size显示from disk cache或from memory cache。
4.不关心服务器端文件是否已经更新
5.强缓存可以通过设置两种HTTP Header实现:Expires 和 Cache-Control。
Expires(http1):
1.缓存过期时间,用来指定资源到期的时间,是服务器端的具体的时间点
2.需要和Last-modified结合使用
3.告诉浏览器在过期时间前浏览器可以直接从浏览器缓存取数据
4.Expires 是 HTTP/1 的产物,受限于本地时间,如果修改了本地时间,可能会造成缓存失效
Cache-Control(http1.1):
1.在HTTP/1.1中,Cache-Control是最重要的规则,主要用于控制网页缓存
2.Cache-Control:max-age=300时,则代表在这个请求正确返回时间(浏览器也会记录下来)的5分钟内再次加载资
源,就会命中强缓存。
3.指令集合:
1)public:所有内容都将被缓存(客户端和代理服务器都可缓存)
2)private:所有内容只有客户端可以缓存,Cache-Control的默认取值
3)no-cache:客户端缓存内容,是否使用缓存则需要经过协商缓存来验证决定,确认一下数据是否还跟服务 器保持一致
4)no-store:所有内容都不会被缓存,即不使用强制缓存,也不使用协商缓存
5)max-age:max-age=xxx (xxx is numeric)表示缓存内容将在xxx秒后失效
6)s-maxage(单位为s):同max-age作用一样,只在代理服务器中生效(比如CDN缓存)
Expires与Cache-Control区别:
1.Cache-Control优先级高于Expires
2.Expires其实是过时的产物,现阶段它的存在只是一种兼容性的写法。
协商缓存:
1.协商缓存就是强制缓存失效后,浏览器携带缓存标识向服务器发起请求,由服务器根据缓存标识决定是否使用缓存的过
程
2.协商缓存可以通过设置两种 HTTP Header 实现:Last-Modified 和 ETag
Last-Modified和If-Modified-Since(http1):
1.浏览器在第一次访问资源时,服务器返回资源的同时在response header中添加 Last-Modified的header,值是这个资
源在服务器上的最后修改时间,浏览器接收后缓存文件和header
2.下一次请求这个资源,添加If-Modified-Since这个header,值就是Last-Modified中的值
3.服务器再次收到这个资源请求,会根据 If-Modified-Since 中的值与服务器中这个资源的最后修改时间对比,没有变化
返回304和空的响应体直接从缓存读取,修改时间说明文件有更新返回新的资源文件和200
ETag和If-None-Match(http1.1):
1.Etag是服务器响应请求时,返回当前资源文件的一个唯一标识(由服务器生成),只要资源有变化,Etag就会重新生成
2.浏览器在下一次加载资源向服务器发送请求时,会将上一次返回的Etag值放到request header里的If-None-Match里,
服务器只需要比较客户端传来的If-None-Match跟自己服务器上该资源的ETag是否一致
区别:
1.Last-Modified如果本地打开缓存文件,即使没有对文件进行修改,但还是会造成 Last-Modified 被修改,服务端不能
命中缓存导致发送相同的资源
2.Last-Modified只能以秒计时,如果在不可感知的时间内修改完成文件,那么服务端会认为资源还是命中了,不会返
回正确的资源
3.首先在精确度上,Etag要优于Last-Modified
4.负载均衡的服务器,各个服务器生成的Last-Modified也有可能不一致
5.在性能上,Etag要逊于Last-Modified,毕竟Last-Modified只需要记录时间,而Etag需要服务器通过算法来计算出一个hash值
6.在优先级上,服务器校验优先考虑Etag
缓存机制
强制缓存优先于协商缓存进行,若强制缓存(Expires和Cache-Control)生效则直接使用缓存,
若不生效则进行协商缓存(Last-Modified / If-Modified-Since和Etag / If-None-Match),
协商缓存由服务器决定是否使用缓存,若协商缓存失效,那么代表该请求的缓存失效,返回200,
重新返回资源和缓存标识,再存入浏览器缓存中;生效则返回304,继续使用缓存
如果什么缓存策略都没设置,那么浏览器会怎么处理?
对于这种情况,浏览器会采用一个启发式的算法,通常会取响应头中的 Date
减去 Last-Modified 值的 10% 作为缓存时间。
实际场景应用缓存策略:
1.频繁变动的资源: Cache-Control: no-cache
2.不常变化的资源: Cache-Control: max-age=31536000
用户行为对浏览器缓存的影响
1.打开网页,地址栏输入地址: 查找 disk cache 中是否有匹配。如有则使用;如没有则发送网络请求。
2.普通刷新 (F5):因为 TAB 并没有关闭,因此 memory cache 是可用的,会被优先使用(如果匹配的话)。其次才是 disk cache。
3.强制刷新 (Ctrl + F5):浏览器不使用缓存,因此发送的请求头部均带有 Cache-control: no-cache(为了兼容,还带了 Pragma: no-cache),服务器直接返回 200 和最新内容。