什么是重定向?
URL 重定向,也称为 URL 转发,是一种当实际资源,如单个页面、表单或者整个 Web 应用被迁移到新的 URL 下的时候,保持(原有)链接可用的技术。-来自MDN
在MDN中HTTP的重定向一文中,介绍了3种重定向。
- http的重定向;
- HTML的重定向;
- JavaScript的重定向;
其中第一和第三种比较常见,大部分前端开发者应该写过第三种
window.location = 'https://xxx';
本文所介绍的301、302和307属于http的重定向。
http 协议提供了一种特殊形式的响应—— HTTP 重定向(HTTP redirects)来执行重定向操作(只是告知具体的状态码3xx,具体由浏览器执行)。
永久重定向
顾名思义,永久重定向说明当前的URL不再使用了,永远都重定向到新的URL,以状态码的形式告知浏览器。所以搜索引擎以及其他爬虫识别到该状态码时,会更新旧 URL 的资源。在http状态码中,以301代表永久重定向(还有308但我还没见过)。
应用场景包括:域名重定向,http到https等。
搜索引擎会更新301的资源地址。如下,ahrefs博客旧地址是blog.ahrefs.com,搜索引擎抓取到301状态码后,会更新该资源地址为ahrefs.com/blog。搜索ahrefs博客可以看到用的是新的地址:
临时重定向
有时候请求的资源无法从其标准地址访问,但是却可以从另外的地方访问。在这种情况下可以使用临时重定向将请求转移到另一个地方。http状态码302、307(还有303但我没见过)都属于临时重定向。
- 302: Found
- 307:Temporary Redirect
302解释: GET方法不会发生变更,其他方法有可能会变更为GET方法。 -来自MDN
307与302的区别在于,收到307响应码后,客户端应保持请求方法不变向新的地址发出请求。
应用场景:http重定向到https、未登录的用户重定向到登录页、404后跳转首页等。
举例,用http://www.baidu.com访问百度。
实际上,当我再次用浏览器打开http://www.baidu.com/,状态码就变成307了并且含义跟rfc规范中的Temporary Redirect不一致。
仔细想来,目前为止我都没见过307 Temporary Redirect ,只见过307 Internal Redirect。
注意 Non-Authoritative-Reason: HSTS响应头。这是HTTP 的严格传输安全 (HSTS)。
这是一个虚假的响应,不是由服务器生成的, 由 Chrome 创建的虚拟 307 响应,并重定向到地址的 https 版本。因为chrome维护了一份HSTS站点列表,知道该域名必须要https方式请求,于是截获http请求后,做出 307响应。
那浏览器是如何知道这个baidu.com这个域名需要使用严格传输安全 (HSTS) 呢?
答案是第一次重定向到(或者直接访问)https://www.baidu.com,响应头中有一个特殊的头:
Strict-Transport-Security: max-age=172800
告诉浏览器在172800s内直接去使用https访问。
有趣的事,我在火狐上用同样的例子baidu测试,第一次302重定向之后,第二次再用http://www.baidu.com访问,火狐会直接访问https://www.baidu.com。
这也可以看到Strict-Transport-Security
响应头的优点:
减少了服务器负载。
由浏览器负责从HTTP到HTTPS的重定向,使网站更快、更安全。
此外,HTTP的 重定向一文中还列出了特殊重定向,把300和304都作为特殊重定向。其中304 是 HTTP 缓存中的一个重要内容,表示资源未修改,相当于将资源重定向到本地缓存。
其实从用户的角度来看,不管是永久还是临时重定向都会发生跳转,浏览器中URL 变成了新的 URL,页面刷新。
参考文档
https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Redirections
https://www.coder.work/article/1770594