import re item = ‘<h1>[风之领域] NO.056 纯纯的女孩 写真集 / 第2页</h1>‘ #item = re.sub(u"([^\u4e00-\u9fa5])","",item)
item = re.findall(r‘[^<>/h1第0-9页a-zA-Z .]‘, item)
#正则去除^<>/h1第0-9页a-zA-Z . 这些符号 item = ‘‘.join(item) item= item.replace(‘[‘,‘‘).replace(‘]‘,‘‘)
#正则去除[] print(item)
常用方法 这两种好理解
原文:https://www.cnblogs.com/aotumandaren/p/13641133.html