首先先明白一下Java web里涉及到编码的地方:
1.jsp编码jsp顶部有两处:charset和pageEncoding
charset:服务器发往客户端展现时的编码;
pageEncoding:设置jsp页面本身的编码
2.jsp在部署后到用户的三个阶段:
- 生成java文件:使用pageEncoding定义的编码格式
- Java文件生成class文件:服务器使用utf-8编码吧Java文件转换成字节码class文件
- 读取class文件传达到用户:服务器获取字节码内容,通过contentType定义的编码格式展现给用户
2.HTML乱码:html 本身含有编码格式
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>Insert title here</title>
</head>
<body>
</body>
</html>
只涉及到表面层,只设置content中的charset的编码格式,
request中文路乱码:没有在当前的jsp中设置读取数据的编码格式,解决方法:
request.setCharacterEncoding("UTF-8");
但是!这种方法对url传参无效,url传参乱码的解决方法:只能修改服务器的传输拜编码格式:修改安装文件Apache-tomcat-6.0.43\conf下的server.xml
添加:URLEncoding="UTF-8"
respose输出中文乱码
设置response输出的编码格式:
response.setContentType("text/html;charset=UTF-8");
cookie造成的乱码cookie保存到客户端过程需要编码转码
在保存cookie数据前:1.先引用Java.net.*:包中包含URLEncoding类,2.保证request和response编码正确3.使用URLEncoding转码并保存:
<%@ page language="java" contentType="text/html; charset=UTF-8"
import="java.net.*"
pageEncoding="UTF-8"%>
<%
//保证request以及response的编码
request.setCharacterEncoding("UTF-8");
response.setContentType("text/html;charset=UTF-8");
//使用URLEncoder解决cookie中中文问题
String username = URLEncoder.encode(request.getParameter("username"),"UTF-8");
String password = URLEncoder.encode(request.getParameter("password"),"UTF-8");
Cookie usernameCookie = new Cookie("username",username);
Cookie passwordCookie = new Cookie("password",password);
usernameCookie.setMaxAge(864000);
passwordCookie.setMaxAge(864000);
response.addCookie(usernameCookie);
response.addCookie(passwordCookie);
%>
使用URLDecode解码
<%@ page language="java" import="java.util.*,java.io.*,java.net.*" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"
%>
<%
request.setCharacterEncoding("UTF-8");
String username = "";
String password = "";
Cookie[] cookies = request.getCookies();
if(cookies!=null && cookies.length>0){
for(Cookie c:cookies){
if(c.getName().equals("username")){
username = URLDecoder.decode(c.getValue(),"UTF-8");
System.out.println(username);
}
if(c.getName().equals("password")){
password = URLDecoder.decode(c.getValue(),"UTF-8");
}
}
}
%>
1. 项目的编码格式和页面的编码格式不一样不会有乱码问题
2. 页面文件编码格式和页面内容的编码格式不同
:乱码!!! 所以文件编码格式必须和页面内容编码格式相同
3. 在指定pageEncoding时charset会被忽略,指定pageEncoding时页面按照charset编码值显示
但是
当pageEncoding指定为UTF-8时charset指定为GBK,GB2312时不会乱码,但是指定iso-8859-1时显示乱码,为big5时部分乱码
综上所述:在jsp中如果要显示正确的内容,并且保证其显示不乱码,必须要指定contentType 或者 pageEncoding 的属性与文件编码格式一致。并且如果他们都存在,那么pageEncoding必须与文件编码格式一致,contentType必须是中文编码格式才行。
4. 通过URL传递中文参数时接收的乱码情况
参数通过URL传递的时候以http协议传递,格式为iso-8859-1,解决方法:
设置Tomcat服务器全局url请求格式:
在tomcat安装目录的conf/server.xml中找到protocol="HTTP/1.1"的属性配置的连接器,在里面添加URIEncoding属性,具体如下:
<Connector URIEncoding="UTF-8" connectionTimeout="20000"
port="8080" protocol="HTTP/1.1" redirectPort="8443"/>
URIEncoding
但是
这种情况下就不能使用param = new String(param.getBytes("iso-8859-1"),"UTF-8");了,否则反而继续乱码
不管是超链接还是跳转servlet可以直接使用过滤器统一处理任何请求的编码格式
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import org.apache.log4j.Logger;
public class CharacterFilter implements Filter {
private Logger logger = Logger.getLogger(this.getClass());
String encoding = null;
@Override
public void destroy() {
encoding=null;
}
@Override
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain filterChain) throws IOException, ServletException {
if(encoding!=null){
request.setCharacterEncoding(encoding);
response.setCharacterEncoding("encoding");
}
filterChain.doFilter(request, response);
}
@Override
public void init(FilterConfig filterConfig) throws ServletException {
encoding = filterConfig.getInitParameter("encoding");
}
}
web.xml配置
<filter>
<filter-name>characterFitler</filter-name>
<filter-class>com.struts2.util.CharacterFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>characterFitler</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
敲黑板:这是个概率事件!!!在处理get请求的时候成功率只有60~70%
5.在PrintWriter输出的时候出现乱码:
在servlet请求顶部添加response.setContentType("text/html;charset=UTF-8"); 设置内容编码格式
划重点 划重点
(1)在参数的时候出现乱码,如果是get请求可以统一设置tomcat的uri编码处理格式,这样所有的url发送的请求都是以指定格式发送。
(2)request.setCharacterEncoding("UTF-8");主要用户 get/post请求中设置整个servlet的编码格式,好处是防止传递的中文参数乱码。
(3)response.setContentType("text/html;charset=UTF-8"); 主要用于指定当前请求中的内容格式,好处是防止输出内容的时候防止中文乱码。
(4)如果在处理中文乱码中以上方法都解决不了,那就要使用js前段编码两次,后台解码的方式处理
6.在框架中解决乱码
1.struts2中:在struts.xml中配置一个常量来指定所有Post请求的编码
<constant name="struts.i18n.encoding" value="UTF-8"></constant>
spring中在web.xml中配置一个过滤器
<filter>
<filter-name>encodingFilter</filter-name>
<filter-class>org.springframework.web.filter.CharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>UTF-8</param-value>
</init-param>
<init-param>
<param-name>forceEncoding</param-name>
<param-value>true</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>encodingFilter</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>