正则表达式简单入门
正则表达式在平常编程中有着大量的应用,对于任何一个想学习编程的人来说,正则表达式是一个必须掌握的知识。
废话不多说,下面先对正则表达式做一个简单的入门介绍,在后续的文章中,将会进行详细的介绍。
一、元字符
元字符一共有12个:$ ( ) [ { ? + * . ^ \ |
元字符有特殊的含义,如果要使用其字面值,则必须对其进行转义。
如: \$ \* \( 等等
二、控制字符或不可打印字符
\a 警报
\e 退出
\f 换页
\n 换行
\r 回车
\t 水平制表
\v 垂直制表
三、简写
\d 单个数字 [0-9] (注意:[]表示取中括号里面所有字符的其中之一; -是连接字符,表示大于等于0小于等于9的所有字符)
\w 字母、数字、下划线
\s 空白字符,包括空格、换行符、制表符
注意:\D \W \S匹配的是\d \w \s不能匹配的字符
四、重复
固定次数:{8} ---重复8次
无限次:{n}
零次或多次:{0,} 等价于 *
一次或多次:{1,} 等价于 +
零次或一次:{0,1} 等价于 ?
下面我们来看一个例子:
匹配时间格式,要求如下:
1.时分秒分别用两个数字表示,毫秒用三个数字表示
2.时对应的范围:00--99
3.分和秒对应的范围:00--59
4.毫秒对应的范围:000--999
5.按如下格式:12:34:56.789
解答:
1、时的两位数字均为0到9其中之一,我们可以表示成[0-9][0-9]或[0-9]{2}或\d\d或\d{2}
2、分和秒的格式是一样的,并且其前面均有:,所以我们表示成(:[0-5]\d){2}
3、毫秒可以表示成\d\d\d或\d{3}
综上:\d\d(:[0-5]\d){2}\.\d{3} 注意此处有一个元字符".",我们取其字面值,需要转义。
用RegexBuddy验证:
原文:http://blog.csdn.net/liujian619/article/details/41808197