背景
最近关于web界面偶有反馈拉到旧的界面,导致出现一些异常情况;
因此,对web资源的加载、缓存进行一些梳理。
正文
一、缓存相关概念介绍
NSURLCache是iOS系统常用的web缓存方式,通过
[NSURLCache sharedURLCache]
获取默认的缓存相关信息;可以在启动的时候,通过[NSURLCache setSharedURLCache:URLCache]
的方式设置一个自定义的NSURLCache。NSCache和NSURLCache名字相近,其实没有什么关系;NSCache可以认为是一个字典缓存,在内存不足的时候会自动释放对象。虽然是系统提供的官方缓存类,但是实际开发中并没有使用,替代者是YYCache。
URLProtocol是iOS系统对URL请求行为进行抽象,细化出每一步操作,让开发者可以针对每一步进行代理,实现对特定请求的拦截,并返回本地的数据。
使用的时候,首先通过canInitWithRequest:(NSURLRequest *)request
,告诉系统要进行代理;
然后在startLoading
中,通过判断request和本地缓存信息,判断本次请求是否可以返回本地数据,并相应调用client的方法;
举例,下面就是读取本地数据,判断ETag是否相同,进而返回304的逻辑:
NSString *requestETag = request.allHTTPHeaderFields[@"If-None-Match"];
NSString *etag = localData.eTag?:@"";
NSDictionary *headerFields = @{@"Cache-Control" : @"max-age=600", @"ETag":etag, @"Access-Control-Allow-Origin" : @"*"};
if (requestETag.length > 0 && [requestETag isEqualToString:etag]) {
NSURLResponse *response = [[NSHTTPURLResponse alloc] initWithURL:request.URL statusCode:304 HTTPVersion:nil headerFields:headerFields];
[self.client URLProtocol:self didReceiveResponse:response cacheStoragePolicy:NSURLCacheStorageAllowed];
[self.client URLProtocolDidFinishLoading:self];
}
NSURLCache和URLProtocol的差别:
1、NSURLCache只支持GET请求,URLProtocol还支持Post请求;
2、NSURLCache清理缓存通常使用removeAllCachedResponses清理全部缓存,URLProtocol是代理资源加载过程,本地磁盘的资源存储由业务控制;
二、HTTP的缓存机制
以某个web界面加载为例,当我们不使用浏览器缓存时,返回的response是完整的html文本,同时还附带着ETag;
如果打开缓存策略,则请求头带了If-None-Match(对应直接的ETag: "5e58f3dd-b0b"),此时回包体积明显变小,同时返回码是304;
当请求或者response带有no-cache、max-age=0时,缓存的资源仍可使用,但是会通过请求进行验证,类似上面的ETag,返回304表示Not Modified,可以继续使用;(no-cache,并非放弃缓存)
而当max-age=3600时,表示资源有效时间是1个小时,在有效时间内不需要通过后端验证,此时不需要发起网络请求,会直接由cache返回数据。(前提是客户端的request的header,没有设置no-cache和max-age=0)
一个资源的请求流程:
关于request和response的总结:
- request的header是资源请求的核心控制参数,如果request的cache策略是no-cache或者max-age=0,则一定会验证资源;
- request没有设置cache-control的策略,则按照response的策略进行,如果age大于reponse的max-age或者response设置了no-cache,则会进行资源校验;如果reponse设置了max-age=x,客户端的age当前小于x,则不会发起网络请求,直接使用cache的数据;
web同学表示,web界面通常不会设置request的cache-control,因为静态资源的加载永远在js之前;
即使是在html的最前面加上cache-control的<meta>标签,也是在html拉到之后才能生效;
(但是客户端开发可以设置request-header)
三、业务缓存逻辑(web缓存SDK)
在前面的client->cache->server基础上,web缓存SDK所在的层级是在cache和server之间;
cache属于浏览器自身的缓存,web缓存SDK相当于代理,阻断了浏览器发起的网络请求,如果本地有匹配的数据,则使用本地数据返回,如果没有使用网络请求,最终所有的数据都会加载到cache;
web缓存SDK和上面的缓存策略并没有关系,上面的缓存策略决定是否要发起网络请求去验证资源、加载资源,而web缓存SDK则是在请求发起之后直接返回,类似charles的map local;
四、一个历史教训
线上的web界面出现一个bug,web的同学修复完之后,手动刷新了cdn的资源和业务缓存SDK的资源。
但是部分html配置的no-cache失效(设置了max-age=xxx),导致如果之前进入过在拉到之前,会使用浏览器缓存;导致本次启动会一直使用旧的的界面。
解决方案:
1、更换该界面的url,使得cache失效;
2、清除webKit的缓存;
[[WKWebsiteDataStore defaultDataStore] removeDataOfTypes:[WKWebsiteDataStore allWebsiteDataTypes] modifiedSince:[NSDate dateWithTimeIntervalSince1970:0] completionHandler:^{
//清除静态资源成功
}];
总结
HTTP协议的学问博大精深,这次借此对缓存相关知识进行一次梳理。
如有纰漏,欢迎指正;如有关于缓存的使用建议,欢迎交流。
参考链接
https://stackoverflow.com/questions/27105094/how-to-remove-cache-in-wkwebview