备忘一下url相关的编码

时间：2014-04-26 18:10:32 阅读：538 评论：0 收藏：0 [点我收藏+]

1 Java中汉字在String中编码为Unicode. java.lang.String.getBytes(String charsetName)会进行重新编码，所以url.getBytes("unicode").length与url.getBytes("utf8").length结果可能不一样

2 java.net.URLEncoder.encode(String s, String charsetName), 对以下字符之外的字符做转码(‘a-z‘, ‘A-Z‘, ‘0-9‘, ‘-‘, ‘_‘, ‘.‘, ‘*‘), 特殊的是‘ ‘会被替换成‘+‘. 其他字符，包括汉字，会被替换成%xxx。

3 URL中的参数value值不能出现：‘+‘ ‘ ‘ ‘/‘ ‘#‘ ‘&‘ ‘=‘ ‘?‘ ‘%‘, 如果要出现的话需要转码。

4 理论上来说url中的paramValue出现2中安全字符外的其他字符都会被认为是非法URL，一般浏览器会自动encode. servlet中调用request.getParameter();方法会自动解码，有一个比较trick的地方是如果要根据原有url重新拼新url，String paramValue = request.getParameter(paramKey);一定要对paramValue encode一下才能拼接，掉过坑

5 base64是否可以代替URLEncoder.encode. 不可以。编码后的64个字符集：ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/ 比如最后编码为+，request.getParameter();方法自动解码后变成空格

备忘一下url相关的编码,布布扣,bubuko.com

备忘一下url相关的编码

原文：http://www.cnblogs.com/daimin/p/3691657.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)