URL编码

时间：2020-06-18 18:56:23 阅读：75 评论：0 收藏：0 [点我收藏+]

为什么在URL中的字符需要被编码

因为URL参数字符串中使用key=value键值对这样的形式来传参，键值对之间以&符号分隔，如果参数中有"="或"&"则会引起误解

如何编码

使用urllib.parse的quote和unquote方法，如：

>>> quote("环==//()WLKJLI__..--~~")
‘%E7%8E%AF%3D%3D//%28%29WLKJLI__..--%7E%7E‘

不会被编码的非特殊字符：字母、数字、"_.-"、默认的安全字符"/"

urllib.parse.quote(string, safe=‘/‘, encoding=None, errors=None)

quote方法会将字符串中的特殊字符进行UTF-8编码（默认编码方式），然后每个字节用16进制表示，字节前加上"%"符号分割，如"环"的UTF-8编码是:

>>> "环".encode("utf-8")
b‘\xe7\x8e\xaf‘

就表示成%E7%8E%AF

quote的返回值仍是unicode字符串

如何解码

如果在浏览器或Postman中用了被编码的参数字符串放在url中发起请求，它们会自动将请求的参数unquote，如

GET http://127.0.0.1:8000/api/order/?orderId=WoQ%3D%3D

观察浏览器发起的请求参数发现orderId: WoQ==。已经解码

而如果是用request发起get请求，则需要将放到data中的数据先用unquote解码，否则，requests会将已经编码的字符串再次编码，如

# client
requests.get(‘http://127.0.0.1:5000/api/test_quote/‘, {"order_id": "1%3D%3D1"})

# server
[18/Jun/2020 17:55:28] "GET /api/test_quote/?order_id=1%253D%253D1 HTTP/1.1" 200 2

参考资料

urllib.parse --- Parse URLs into components

python之urlencode()，quote()及unquote()

URL编码

原文：https://www.cnblogs.com/luozx207/p/13158953.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)