使用正则表达式的目标是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了。
常用的正则表达式字符:
字符 | 意义 | 示例 |
^word | 待查找的字符串在行首 | ^\d表示必须以数字开头 |
word$ | 待查找的字符串在行尾 | \d$表示必须以数字结尾 |
. | 代表一定有任意一个字符 | ‘py.‘可以匹配‘pyc’、‘py!’、‘py#’等等 |
\ | 转义字符,将特殊符号的特殊含义去除 | ‘\\\\’可以匹配字符串‘\\’ |
* | 表示重复任意个的前一个字符(包括0个) | ‘ess*‘可以匹配‘es‘、‘ess‘、‘esss’等字符串 |
+ | 表示重复一个及以上的前一个字符 | ‘go+d‘可以匹配‘good‘、‘goood’、‘gooood’等字符串 |
? | 表示重复零个或一个的前一个字符 | ‘go?d’仅能匹配‘gd‘或者‘god’这两个字符串 |
| | 用或的方式找出数个字符串 | ‘AB’|‘BCD’匹配字符串‘AB’或者‘BCD’ |
[] | 表示从字符集合里面找出想要选取的字符或字符范围 | [gl\_]--从中选取g或者l或者_,[0-9a-z]--匹配字符串‘0f‘、‘1j‘等等 |
{n} | 表示n个字符 | \d{3}表示匹配3个数字,例如‘010‘ |
{n,m} | 表示n-m个字符 | \d{3,8}表示匹配3-8个数字,例如‘1234567‘、‘876’ |
() | 表示要提取的分组(Group) | ^(\d{3})-(\d{3,8})$可以匹配字符串 ‘010-12345‘ |
原文:https://www.cnblogs.com/zhouxingyu1993/p/12104791.html