网上翻了很多文章。。。居然没有一个有用的。。倒是找到一篇java的,但java的正则表达式和python的还有点不同。
那篇java的文章是用"[keywd1]|[keywod2]|[keywd3]"的模式来匹配,这个在py中就不行了,[]会匹配[]中的任何一个分字。
在python中的应该是"keywd1|keywd2|keywd3"就行了。
然后我个人是喜欢直接使用re.findall() 这样一个参数是要匹配的字符模式,另一个就是要匹配的文本。比较方便,可以不用管那些search,march,啥的。
再一个就是备注一下正则表达式匹配的参数先后顺序:re.findall(pattern, string[, flags]) # [, flags]为可选参数,从第几个字符开始匹配