其中,re.findall() 函数可以遍历匹配,可以获取字符串中所有匹配的字符串,返回一个列表。
在python源代码中,展示如下: 搜索string,返回一个顺序访问每一个匹配结果(Match对象)的迭代器。找到 RE 匹配的所有子串,并把它们作为一个迭代器返回。
findall(pattern, string, flags=0)
第一个参数,正则表达式
第二个参数,搜索的是那些字符串
第三个参数,匹配的模式,其中re.S使匹配包括换行在内的所有字符。findall()函数是逐行匹配的。
返回string中所有与pattern相匹配的全部字串,返回形式为数组
如果想要使用re.findall函数,必须引用re包
import re string = ‘Aashfghjj234ldjf245‘ pattern = ‘\d+?‘ reg = re.findall(pattern,string) print(reg)
re.S
有时候我们在爬虫的时候会见到这个参数,使 . 匹配包括换行在内的所有字符
re.I
使匹配对大小写不敏感
re.L
做本地化识别(locale-aware)匹配
re.M
多行匹配,影响 ^ 和 $
re.U
根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B.
re.X
该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解。
原文:https://www.cnblogs.com/blackball9/p/11845868.html