在c#中如何使用html agility pack获取唯一的所有标签列表

苏悦

如何从 html 字符串中获取所有标签的唯一列表。但我只能一一提取标签。

代码

public static void HtmlParser()
{
    string html = @"<TD >
    <DIV align=right>Name :<B> </B></DIV></TD>
    <TD width=""50%"">
        <INPUT class=box value=John maxLength=16 size=16 name=user_name>
    </TD>
    <TR vAlign=center> <code> This is a <kwd>vba</kwd> code piece</code>  Hi I am sujoy";

    HtmlDocument htmlDoc = new HtmlDocument();
    htmlDoc.LoadHtml(html);
    string code = htmlDoc.DocumentNode.
    .SelectSingleNode("//code").InnerHtml;
    string TD = htmlDoc.DocumentNode
    .SelectSingleNode("//TD").InnerText;
}

对于上面的代码中,我所要的输出是list{"DIV","TD","TR","CODE"}

苏悦

使用htmlDoc.DocumentNode.Descendants()和 用于唯一列表使用HashSet

public static void HtmlParser()
{
    HtmlDocument htmlDoc = new HtmlDocument();
    htmlDoc.LoadHtml("Your html string containing tags like <div></div>...");
    HashSet<string> hs = new HashSet<string>();
    foreach(var dec in htmlDoc.DocumentNode.Descendants())
    {
        hs.Add (dec.Name);
    }
}

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

HTML Agility Pack Xpath

来自分类Dev

Cookies HTML Agility Pack?

来自分类Dev

HTML Agility Pack Xpath

来自分类Dev

HTML Agility Pack,SelectSingleNode

来自分类Dev

C#-使用HTML Agility Pack获取标签内的文本

来自分类Dev

HTML Agility Pack C#

来自分类Dev

如何使用HTML Agility Pack解析HTML

来自分类Dev

使用HTML Agility Pack获取特定的表

来自分类Dev

使用HTML Agility Pack获取特定的表

来自分类Dev

无法使用HTML Agility Pack抓取所有HTML代码

来自分类Dev

无法使用HTML Agility Pack抓取所有HTML代码

来自分类Dev

如何使用HTML Agility Pack获取所有在其属性值中包含特定字符串的HTML标记?

来自分类Dev

HTML Agility Pack:替换脚本标签

来自分类Dev

从HTML Agility Pack HtmlWeb获取HttpWebResponse

来自分类Dev

使用HTML Agility Pack的HTML页面解析

来自分类Dev

HTML Agility Pack是否选择所有标题?

来自分类Dev

HTML Agility Pack:如何抓取<tr>文本?

来自分类Dev

使用HTML Agility Pack设置img src

来自分类Dev

如何使用HTML Agility Pack修复格式错误的HTML?

来自分类Dev

如何使用HTML Agility Pack修复格式错误的HTML?

来自分类Dev

HTML Agility Pack在页面上获取所有锚点的href属性

来自分类Dev

如何使用 WebRequest 和/或 HTML Agility Pack 在 Content-Disposition 附件中获取文件

来自分类Dev

使用HTML Agility Pack的C#Null异常

来自分类Dev

指定节点范围-Xpath / HTML Agility Pack

来自分类Dev

HTML agility pack get all divs with class

来自分类Dev

HTML Agility Pack-新的HtmlAttribute

来自分类Dev

Html Agility Pack: replacing script tags

来自分类Dev

HTML Agility Pack xpath引发空异常

来自分类Dev

Appy HTML Agility Pack对网页的更改

Related 相关文章

热门标签

归档