首页 > 移动平台 > 详细

IOS 去掉代码html中的标签元素,获得纯文本

时间:2014-08-07 13:05:30      阅读:582      评论:0      收藏:0      [点我收藏+]

content是根据网址获得的网页源码字符串

   NSRegularExpression *regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"<[^>]*>|\n"  options:0  error:nil];
 
//替换所有html和换行匹配元素为"-"     
   content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];
     
   regularExpretion=[NSRegularExpression regularExpressionWithPattern:@"-{1,}" options:0 error:nil] ;
 
//把多个"-"匹配为一个"-"
   content=[regularExpretion stringByReplacingMatchesInString:content options:NSMatchingReportProgress range:NSMakeRange(0, content.length) withTemplate:@"-"];
     
    //根据"-"分割到数组
    NSArray *arr=[NSArray array];
    content=[NSString stringWithString:content];
    arr =  [content componentsSeparatedByString:@"-"];
    NSMutableArray *marr=[NSMutableArray arrayWithArray:arr];
    [marr removeObject:@""];
    return  marr;

IOS 去掉代码html中的标签元素,获得纯文本,布布扣,bubuko.com

IOS 去掉代码html中的标签元素,获得纯文本

原文:http://www.cnblogs.com/luoyubuku/p/3896712.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!