常用模块

时间：2018-01-09 19:41:14 阅读：235 评论：0 收藏：0 [点我收藏+]

re模块常用方法：

　　import re

　　ret = re.findall(‘a‘,‘qas fds asfwa‘) #返回所有满足条件的结果，放在列表里
　　print(ret)　　#结果：[‘a‘,‘a‘,‘a‘]

　　ret = re.search(‘a‘,‘qas fds asfwa‘).group() #只找到第一个符合匹配的然后返回，一定要加group返回匹配的字符串，如果没有则返回None 结果：a

　　ret = re.match(‘a‘,‘abc‘).group() #跟search差不多，不过只在字符串开始处进行匹配，开头不是会报错　结果：a

　　ret = re.split(‘[ab]‘,‘abcd‘) #先按‘a‘分割得到‘‘和‘bcd‘，在对‘‘和‘bcd’分别按‘b‘分割结果：[‘‘,‘‘,‘cd‘]

　　ret = re.sub(‘\d‘,‘H‘,‘fdsf32cs3fds1‘ ,2) #将数字替换成 ’H‘，只替换前2个值，不写则全部替换

　　ret = re.subn(‘\d‘,‘H‘,‘fdsf32cs3fds1‘ ) #返回的是元组，不写值替换所有

　　obj = re.compile(‘\d{3}‘)　　　　#编译成一个正则表达式对象，匹配连续3个数字，可以多次调用这个对象
　　ret = obj.search(‘a324e‘)　　　　#正则表达式对象调用search，参数为待匹配的字符串
　　print(ret.group())　　　　　　#需要用group（），结果：324

　　ret = re.finditer(‘\d‘,‘afd2312a‘)　　#返回一个迭代器，里面存放匹配结果
　　print(ret)　　　　　　　　　　　　#内存地址
　　print(next(ret).group())　　　　　　#查看第一个结果
　　print(next(ret).group())　　　　　　#查看第二个结果
　　print([i.group() for i in ret]) 　　　　#查看剩余的左右结果

findall的优先级查询：

　　ret = re.findall(‘www.(badi|sohu).com‘,‘www.sohu.com‘)　
　　print(ret)　　　　　 #结果：[‘sohu‘] 因为findall会优先把匹配结果组里内容返回，如果想要匹配结果，取消权限即可
　　ret = re.findall(‘www.(?:badi|sohu).com‘,‘www.sohu.com‘)
　　print(ret)　　　　　#结果：[‘www.sohu.com‘]

split的优先级查询：

　　ret = re.split(‘\d+‘,‘asdf2fa43fd‘)　　
　　print(ret)　　#结果：[‘asdf‘, ‘fa‘, ‘fd‘]

　　ret = re.split(‘(\d+)‘,‘asdf2fa43fd‘)
　　print(ret)　　#结果：[‘asdf‘, ‘2‘, ‘fa‘, ‘43‘, ‘fd‘]

　　在匹配部分加上（）之后所切出的结果是不同的，

　　没有（）的没有保留所匹配的项，但是有（）的却能够保留了匹配的项，

　　这个在某些需要保留匹配部分的使用过程是非常重要的。

常用模块

原文：https://www.cnblogs.com/tsboy/p/8253023.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)