注意本文只讨论href等在链接中含有中文导致的RFC 7230 and RFC 3986 问题,其他情况导致的不在讨论范围之内,其他情况可能原因及处理方法都有所不同。
问题描述
在开发的项目中有一个页面,a元素的href中有个参数使用了中文,类似下面代码:
<a href="?kw=敏感词">搜索</a>
在ie浏览器(如ie11)下点击该链接后会报错,而其他浏览器正常:
网上求助
按照这个错误的关键词在网上搜索资料,可以搜出一些解决方案,如下:
1、更换低版本的Tomcat
这个方案显然不行,降低版本可能暂时能解决这个问题,但是tomcat为啥升级,当然是进行了一些优化和内部改造,而且还可能存在jdk版本不兼容的问题,所以权衡一下显然降低版本是不合适的。
2、修改tomcat配置文件catalina.properties
在Tomcat的安装目录中,打开conf/catalina.properties,找到末尾的一行。增加两行配置:
tomcat.util.http.parser.HttpParser.requestTargetAllow=|{}
org.apache.tomcat.util.buf.UDecoder.ALLOW_ENCODED_SLASH=true
3、修改tomcat的配置文件server.xml 经测试无效,至于为何无效后面说。
增加URIEncoding="utf-8"
<Connector port="8080" protocol="HTTP/1.1"
connectionTimeout="20000"
redirectPort="8443" URIEncoding="utf-8"/>
经测试无效,原因后面说。
4、根据官方文档上说的修改relaxedPathChars 和relaxedQueryChars 这两个属性
<Connector connectionTimeout="20000" port="6080"
protocol="HTTP/1.1" redirectPort="8443"
relaxedPathChars="|{}[],%" relaxedQueryChars="|{}[],%"/>
经测试也无效果。
5、使用encodeURIComponent进行转码
<a href="javascript:location.href='${ctxPath}/bbs/index?topic='+encodeURIComponent('${hotTopic}');">${hotTopic}</a>
经测试,此方法正常。
思考时间
那么问题来了,为什么ie下不正常,其他浏览器正常,ie下不正常的情况有哪些,经过测试总结如下:
仅限于ie浏览器(ie7-ie11都有问题,其他版本未测试应该也都有问题)有问题
如果是form表单中get提交的中文参数值正常
href、src等链接中出现中文值不正常
然后我们接下来看为什么?可以肯定是浏览器编码的问题。
抓包分析
使用抓包工具进行抓包分析,可以使用Fiddler或者轻量级的uTools内部插件http(s)抓包。以Fiddler为例:
页面代码如下:
<form>
<input name="kw" value="敏感词">
</form>
<a href="?kw=敏感词">搜索</a>
先直接表单提交(因为只有一个input,直接回车就是提交),此时提交页面不会出错,查看抓包的情况:页面上放置一个form(默认即为get方法)里面有中文参数值,写一个a,href内包含中文。
可以看到参数直接上转换为了URL编码,这样是没有问题的。
然后点击a链接,这是就会报错,错误信息同一开始提到的,那么再看此时的抓包情况:
可以看到没有转码:
那么切换到16进制视图(HexView)查看真实的编码:可以看到参数已经变成了乱码显示,找到对应的位置鼠标左键点击一下即可看到对应的16进制编码
查看该编码对应的汉字,我这边使用的是https://www.qqxiuzi.cn/bianma/zifuji.php
可以看到这几个编码对应的正是“敏感词”这三个字的GB2312编码。
切换其他正常的浏览器看这个地方的编码是什么样的。
可以看到是URL编码的,URL编码到tomcat后根据配置转换为中文或者手动转换(与tomcat版本和配置有关,最新版的基本不需要设置可以自动转换),总之使用URL编码是正常的,确定是ie浏览器默认编码的问题。那么解决方案就是转换编码,至于方案2、4是针对具体某个字符的放行,而浏览器传入已经整个成为乱码,没法单独放行某个字符所以无效,方案3之所以无效是因为产生乱码是浏览器传入后服务器之前就是乱码了,后面再修改编码也无效。
至此原因及解决方案都已经弄清楚了,需要注意的一点是传参时不建议用中文,尽量转换为对应的英文或数字,不用中文自然也就没有这样的问题了。