从excel文件(xlsx)中使用pandas读取,最终导出一个字符串列表,元素包含一系列的_x0000_
,如何去除?
代码如下:
import pandas as pd
df = pd.read_excel(‘地名.xlsx‘)
a = df.iloc[:,0].values.tolist()
c = [x.strip() for x in a]
print(c)
使用strip()
也没用,
输出结果类似为:
[‘皋兰路_x0000__x0000__x0000_‘, ‘天庆家园_x0000__x0000__x0000__x0000_‘, ‘煤炭厂_x0000_‘]
c = [x.strip(‘_x0000_‘) for x in a]
输出正常:
[‘皋兰路‘, ‘天庆家园‘, ‘煤炭厂‘]
这个“x0000”在xlsx中显示类似于空格,但是读取成字符串就会变成这一串,不应该是空格吗,为什么直接使用strip()
也不能去除(需要视为一般的字符串)?
原文:https://www.cnblogs.com/li--si/p/14392652.html