删除HTML中的样式标签

迪玛斯

我需要完全删除给定HTML代码的所有样式标签。我发现以下正则表达式可以匹配XML中的整个样式标签。对于在线正则表达式测试器中给定的HTML代码,它工作正常。

*style\s*=\s*('|")[^\2]*?\2([^>]*)*

但是,通过C#代码,它不适用于给定的HTML。

以下是C#代码:

Regex regex = new Regex("style\\s*=\\s*('|\")[^\\2]*?\\2([^>]*)", RegexOptions.IgnoreCase);
阿尼鲁达

正则表达式应该是

 style\s*=\s*('|")[^\1]*\1

虽然我会使用Htmlagilitypack

   HtmlDocument doc = new HtmlDocument();
   doc.Load(yourStream);
   var elementsWithStyleAttribute = doc.DocumentNode.SelectNodes("//@style");
   foreach (var element in elementsWithStyleAttribute)
   {
       element.Attributes["style"].Remove();
   }
   doc.Save();

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从html删除标签样式

来自分类Dev

使用Regex C#从HTML标签中删除样式

来自分类Dev

使用jQuery从HTML页面删除样式标签

来自分类Dev

从html页面中删除所有样式,脚本和html标签

来自分类Dev

从数组中删除html标签

来自分类Dev

删除脚本中的HTML标签

来自分类Dev

从HTML列表元素中删除默认样式

来自分类Dev

用 html 标签替换聊天文本中的符号对,使其样式为粗体、斜体和删除线

来自分类Dev

从特定标签中删除样式BeautifulSoup / Python

来自分类Dev

删除脚本和样式标签中的所有内容

来自分类Dev

Tampermonkey:从TD标签中删除字体粗细样式

来自分类Dev

在Wordpress(Javascript)中删除特定标签上的样式

来自分类Dev

删除样式标签上的样式属性

来自分类Dev

jQuery:删除特定的样式标签

来自分类Dev

jQuery:删除特定的样式标签

来自分类Dev

删除TinyMCE中的html,head,body标签

来自分类Dev

从txt文件中删除HTML标签

来自分类Dev

sed从html文件中删除标签

来自分类Dev

在RSS feed中删除HTML标签

来自分类Dev

如何从RSS feed中删除HTML标签?

来自分类Dev

从页面中删除特定的html标签

来自分类Dev

如何删除PHP中的HTML标签?

来自分类Dev

删除RSS feed中的HTML标签

来自分类Dev

从xpath @attribute中删除html标签

来自分类Dev

如何从RSS feed中删除HTML标签?

来自分类Dev

从字符串中删除html标签

来自分类Dev

删除html文件中匹配的标签?

来自分类Dev

删除 JSON 结果中的 HTML 标签

来自分类Dev

从 std::string 中删除 HTML 标签