首页 > 其他 > 详细

如何去除xlsx中读取的字符串末尾字符“_x0000_”

时间:2021-02-09 18:08:56      阅读:105      评论:0      收藏:0      [点我收藏+]

问题描述

从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_,如何去除?
代码如下:

import pandas as pd

df = pd.read_excel(‘地名.xlsx‘)
a = df.iloc[:,0].values.tolist()
c = [x.strip() for x in a]
print(c)

使用strip()也没用,
输出结果类似为:
[‘皋兰路_x0000__x0000__x0000_‘, ‘天庆家园_x0000__x0000__x0000__x0000_‘, ‘煤炭厂_x0000_‘]

解决方法

c = [x.strip(‘_x0000_‘) for x in a]

输出正常:
[‘皋兰路‘, ‘天庆家园‘, ‘煤炭厂‘]

存疑

这个“x0000”在xlsx中显示类似于空格,但是读取成字符串就会变成这一串,不应该是空格吗,为什么直接使用strip()也不能去除(需要视为一般的字符串)?

如何去除xlsx中读取的字符串末尾字符“_x0000_”

原文:https://www.cnblogs.com/li--si/p/14392652.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!