本来以为把jsp页面设置为UTF-8,服务器端用filter把request和response设置为utf-8,中文问题应该就差不多了。
但tomcat似乎中间给我我们加了步骤。
1 页面
页面中设置的编码,我们post的数据就会按照页面的编码进行 encode,
比如 我们要post数据为 site=博客园,如果我们的页面为utf-8格式,
则实际post的数据为 site=%E5%8D%9A%E5%AE%A2%E5%9B%AD
java:URLEncoder.encode("博客园", "utf-8"),
所以我们post给服务器的数据会先经过页面编码的encode。
2 tomcat服务器
当我们直接 request.getParameter(“site”);发现得到的字符串为“?????????”,
因为tomcat自作聪明的把的字符串当成iso8859-1来解码了,
tomcat执行了类似:URLDecoder.decode(str, "iso8859-1");,因为jsp页面默认的编码就是iso8859-1,
就算你改了myeclipse的jsp页面默认编码,但tomcat的还是iso8859-1。
3 servlet
我们的servlet如何得到中文编码呢?我们一步一步的加码解码即可:
URLEncoder.encode(str, "iso8859-1");//把tomcat给我们解码的字符串给加码上
URLDecoder.decode(str, "utf-8");//把浏览器给我们加码的数据解码
总体过程:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
//页面 pageEncoding=utf-8 String str = "博客园" ; str = URLEncoder.encode(str, "utf-8" ); System.out.println(str); //output:%E5%8D%9A%E5%AE%A2%E5%9B%AD //tomcat str = URLDecoder.decode(str, "iso8859-1" ); System.out.println(str); //output:????????? // servlet str = URLEncoder.encode(str, "iso8859-1" ); System.out.println(str); //%E5%8D%9A%E5%AE%A2%E5%9B%AD str = URLDecoder.decode(str, "utf-8" ); System.out.println(str); //博客园 |
知道了tomcat加码解码过程,我们就可以彻底设置解码方式了。
如果是get方式传数据,可以设置解码方式,
在tomcat的server.xml中 connector加上解码方式:
1
2
3
|
<Connector port= "8000" protocol= "HTTP/1.1" URIEncoding= "UTF-8" connectionTimeout= "20000" redirectPort= "8443" /> |
原文:http://www.cnblogs.com/huhuuu/p/3985626.html