首页 > Web开发 > 详细

在html中显示的&#开头字符串究竟是啥?

时间:2020-11-02 20:59:51      阅读:89      评论:0      收藏:0      [点我收藏+]

今天在处理html文件时,发现网页内部的中文字符全部变成了&#开头的字符串,类似于:

  尊敬的:

上述的字符串在网页中会显示为"尊敬的:",这其实是html的的转义序列(escape sequence)。

如果想要看到其对应的中文,最简单的方法是在浏览器中执行它,这样就能显示中文。

当然如果想要在程序中转化的话,需要查询官方文档,看是否有直接转化的接口,例如在Python中,使用标准库HTMLParser,就能正确转化。

  from HTMLParser import HTMLParser
  print HTMLParser().unescape(‘ 尊敬的:‘)

在html中显示的&#开头字符串究竟是啥?

原文:https://www.cnblogs.com/VV-A-VV/p/13916120.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!