项目上很少用到正则表达式,所以知之甚少。以前经常用的就是除去注释的
/\*{1,2}[\s\S]*?\*/
昨天刚买了《Java编程思想》(TIJ)和《Effective Java》(EJ),借此学习热度研究一下。
以下第一部分内容摘自简书。作者是:Vic_is_new_Here。原文地址:https://www.jianshu.com/p/3c076c6b2dc8
一、概念 正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。在众多语言中都可以支持正则表达式,如Perl、PHP、Java、Python、Ruby等。当然在Java中也可以通过处理字符串的方式达到检索,替换文本字符串的目的,但是有了正则表达式写代码更加简洁,通常两三行代码就可以达到目的,当然这也是建立在熟悉正则表达式的基础之上的。 二、正则表达式的规则 1. 任意一个字符表示匹配任意对应的字符,如a匹配a,7匹配7,-匹配-。 2. []代表匹配中括号中其中任一个字符,如[abc]匹配a或b或c。 3. -在中括号里面和外面代表含义不同,如在外时,就匹配-,如果在中括号内[a-b]表示匹配26个小写字母中的任一个;[a-zA-Z]匹配大小写共52个字母中任一个;[0-9]匹配十个数字中任一个。 4. ^在中括号里面和外面含义不同,如在外时,就表示开头,如^7[0-9]表示匹配开头是7的,且第二位是任一数字的字符串;如果在中括号里面,表示除了这个字符之外的任意字符(包括数字,特殊字符),如[^abc]表示匹配出去abc之外的其他任一字符。 5. .表示匹配任意的字符。 6. \d表示数字。 7. \D表示非数字。 8. \s表示由空字符组成,[ \t\n\r\x\f]。 9. \S表示由非空字符组成,[^\s]。 10. \w表示字母、数字、下划线,[a-zA-Z0-9_]。 11. \W表示不是由字母、数字、下划线组成。 12. ?: 表示出现0次或1次。 13. +表示出现1次或多次。 14. *表示出现0次、1次或多次。 15. {n}表示出现n次。 16. {n,m}表示出现n~m次。 17. {n,}表示出现n次或n次以上。 18. XY表示X后面跟着Y,这里X和Y分别是正则表达式的一部分。 19. X|Y表示X或Y,比如"food|f"匹配的是foo(d或f),而"(food)|f"匹配的是food或f。 20. (X)子表达式,将X看做是一个整体。 二、Java中如何写正则表达式 在java中调用正则表达式的类是java.util.regex.Matcher和java.util.regex.Pattern,java.util.regex包是从jdk1.4开始提供的。有多种写法来使用正则表达式。 1. 仅仅是匹配 1). 实现方式1,匹配一个数字。 public void regex1() { //要匹配的字符 String str = "8"; //正则表达式 String regex = "[0-9]"; //返回匹配的结果,匹配成功就返回true,失败就返回false,此次匹配返回true。 boolean flag = Pattern.matches(regex, str); System.out.println(flag); } 2). 实现方式2, 匹配3个到5个字母,大小写不限,包括3和5个。 public void regex2() { //要匹配的字符 String str = "hello"; //正则表达式 String regex = "[a-zA-Z]{3,5}"; //输出匹配的结果, 此次匹配返回true。 System.out.println(str.matches(regex)); } 3). 实现方式3(此种实现方式最快), 匹配11位的电话号码,匹配规则:第一个数字是1,第二个数字是2,3,7,8中任一个,后面9位数字中不包含4。 public void regex3() { //要匹配的字符 String str = "13656231253"; //正则表达式 String regex = "1[2378][0-35-9]{9}"; //将给定的正则表达式编译为模式。 如果匹配需求较多,且需用同相同的regex去匹配,就可将这句写到静态模块里面,用的时候直接使用实例p Pattern p = Pattern.compile(regex); //创建一个匹配器,匹配给定的输入与此模式。 Matcher m = p.matcher(str); //尝试将整个区域与模式进行匹配。 boolean flag = m.matches(); //输出匹配结果,此次结果为true System.out.println(flag); } 2. 替换。 public void regexReplace () { //要匹配的字符 String str = "12a6B985Ccv65"; //正则表达式 String regex = "[a-zA-Z]+"; //正则表达式 String regex2 = "\\d+"; //将字符串中英文字母替换为&符号,输出12&6&985&65 System.out.println(str.replaceAll(regex, "&")); //将字符串中单个数字或者连续的数字替换为0,输出0a0B0Ccv0 System.out.println(str.replaceAll(regex2,"0")); } 3. 切割,根据大写字母切割字符串。 public void outputStr() { String str = "oneTtowTthreeDfourJfive"; String regex = "[A-Z]"; String[] arr = str.split(regex); for (String s: arr) { System.out.print(s + " "); } } 输出:one tow three four five 作者:Vic_is_new_Here 链接:https://www.jianshu.com/p/3c076c6b2dc8 来源:简书 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
然后附注一些常用的
原文:https://www.cnblogs.com/liangxiaotian/p/14209918.html