首页 > 其他 > 详细

删除相邻重复的内容

时间:2015-04-12 20:55:48      阅读:287      评论:0      收藏:0      [点我收藏+]

1、思路:用正则表达式匹配,使用反向引用,替换。查找(.+?)\1 替换为 $1
(.+)\1 为什么不好?因为量词优先,+会尽可能地吃,然后又要一个一个吐出来,效率太差,使用(.+?)\1 取消量词优先,尽量少吃。
(.*?)\1 为什么不好,因为.* 可以匹配没有字符的情况,.+ 要求至少有一个字符,既然是删除相邻重复的内容,当然要求至少有一个字符。
2、删除相邻重复的行,可以转化为删除相邻重复的内容。只不过中间有一个换行符,如下:查找(.+?)(\r\n)\1 替换为 $1。
注意:这里千万不能使用(.*?)(\r\n)\1,会导致没有了换行符,为什么?
因为 (.*?)能匹配空,紧接着换行,反向引用空,替换为空,导致换行符没有了。

删除相邻重复的内容

原文:http://www.cnblogs.com/nzbbody/p/4420208.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!