正则表达式
元字符
- “+” 其前导字符必须在目标对象中连续出现一次或多次
- “*” 其前导字符必须在目标对象中连续出现零次或多次
- “?” 其前导字符必须在目标对象中连续出现零次或一次
- “\s” 用于匹配单个空格,包括Tab键和换行符
- “\S” 用于匹配单个空格之外的所有字符
- “\d” 匹配0-9的数字
- “\w” 匹配字母、数字或下划线
- “\W” 匹配所有与 “\w” 不匹配的字符
- “.” 匹配所有除换行符外的字符
例子 :
元字符 |
例子 |
匹配1 |
匹配2 |
+ |
abc+ |
abc |
abcc |
* |
abc* |
ab |
abcc |
? |
abc? |
ab |
abc |
\d |
\d |
0-9 |
|
\w |
\w |
a-z A-Z 0-9 _ |
|
出现频率
- “{n}” 匹配确定的n次 eg: a{2} aa
- “{n,}” 至少匹配n次 eg:a{2,} aa、aaa、aaaa
- “{n,m}” 至少匹配n次,最多匹配m次
定位符
- “^” 定位符规定匹配模式必须出现在目标字符串的开头 eg: ^hell hello hellllll
- “$”定位符规定匹配模式必须出现在目标字符串的结尾 eg: ello\$ hello aello
- “\b”定位符规定匹配模式必须出现在目标字符串的开头或结尾两个边界之一 eg: \bello ellohhhh ello\b hello
- “\B”定位符规定匹配模式必须出现在目标字符串的开头或结尾两个边界之内(不能在开头,也不能在结尾) eg: \Bbcd\B AbcdE
范围符
- [A-Z] A-Z中的任意一个大写字母
- [a-z] a-z中的任意一个小写字母
常用正则表达式
- 中文字符
[u4e00-u9fa5]
- HTML标签
<(.*)>.*|<(.*)/>
- Email地址
w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*
- 国内电话号码
d{3}-d{8}|d{4}-d{7}
- QQ号
[1-9][0,9]{4,}
- 网址URL
http://([w-]+.)+[w-]+(/[w-./?%&=]*)?
正则表达式基础
原文:http://blog.csdn.net/yen_csdn/article/details/52228427