首页 > 其他 > 详细

提取文本当中的汉字

时间:2016-02-04 11:35:33      阅读:157      评论:0      收藏:0      [点我收藏+]

http://tool.chinaz.com/regex/

[\u4e00-\u9fa5]+\s*[,!?:]*[\u4e00-\u9fa5]+[,!?:]*

 

tool.chinaz>切额地方地,方!<.com|ddd//大声夺地d在在地  方!:88

[\u4e00-\u9fa5] : 表示一下汉字

+ 重复限定词: [1, 无限]

\s : 空格

*: 重复限定词:[0,无限](表达可能有空格,也可能没有空格)

[,!?:] * : 可能出现此类标点符号,也可能没有

[\u4e00-\u9fa5]+ 必须至少出现一人汉字

[,!?:]* 可能出现此类标点符号,也要吧没有

 

原则:

正则表达式当中每一个元素只代表一个字符的含义:

如[\u4e00-\u9fa5] 只表示只要是这个集合就OK

如果想表达多个 : 限定词 *, +

提取文本当中的汉字

原文:http://www.cnblogs.com/pengxinglove/p/5181151.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!