首页 > Web开发 > 详细

使用RegularExpressions去除HTML标签的字符串

时间:2018-01-29 10:32:23      阅读:172      评论:0      收藏:0      [点我收藏+]

1、需求场景

  因为需要做一个推送数据的服务,需要调用webservice,由于某种原因需要使用用http发送soap请求,而推送的数据是json格式的,在测试过程中发现请求失败,服务端webservice返回400错误。返回400错误,应该就是请求的数据格式不对,由于我这个情况特殊,请求的数据既要能够格式化为xml格式,里面某个节点里的内容还要能够正确格式化为json字符串,发现请求的数据里有HTML标签,需要过滤掉再请求。

2、实现功能

  使用RegularExpressions正则表达式:

  .   匹配除 "\n" 之外的任何单个字符。

  *  匹配前面的子表达式零次或多次。

  ?  匹配前面的子表达式零次或一次。

       只要把文章的"<.*?>"替换为String.Empty即可。

 

       代码实现 

using System.Text.RegularExpressions;

public static string RemoveHtmlTag(string articleString)
{
      return Regex.Replace(articleString, "<.*?>", string.Empty);
}       

 

使用RegularExpressions去除HTML标签的字符串

原文:https://www.cnblogs.com/zhao-gang/p/8373171.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!