vb.net使用htmlagilitypack获取所有属性值

史努比·奥胡(Snoopy Ohoo)

这是HTML

<div id="catlist-listview" class="cat-listview cat-listbsize">  
 <ul>
  <li><a href="http://wantedlink1" rel="bookmark" title="sometitel1" class="sonra">title1</a></li>    
  <li><a href="http://wantedlink2" rel="bookmark" title="sometitel2" class="sonra">title2</a></li>
  <li><a href="http://wantedlink3" rel="bookmark" title="sometitel3" class="sonra">title3</a></li>
  <li><a href="http://wantedlink4" rel="bookmark" title="sometitel4" class="sonra">title4</a></li>
  <li><a href="http://wantedlink5" rel="bookmark" title="sometitel5" class="sonra">title5</a></li>
  <li><a href="http://wantedlink6" rel="bookmark" title="sometitel6" class="sonra">title6</a></li>
  <li><a href="http://wantedlink7" rel="bookmark" title="sometitel7" class="sonra">title7</a></li>
  <li><a href="http://wantedlink8" rel="bookmark" title="sometitel8" class="sonra">title8</a></li>
  <li><a href="http://wantedlink9" rel="bookmark" title="sometitel9" class="sonra">title9</a></li>
  <li><a href="http://wantedlink10 " rel="bookmark" title="sometitel10" class="sonra">title10</a></li>
 </ul>
</div>

我的代码是

dim htmldoc as new htmldocument
htmldoc.loadhtml(source)
for each link as htmlnode in htmldoc.document.selectnodes("//*[@id='catlist-listview']/ul")
textbox3.text = link.innerhtml
next

输出是

      <li><a href="http://wantedlink1" rel="bookmark" title="sometitel1" class="sonra">title1</a></li>    
      <li><a href="http://wantedlink2" rel="bookmark" title="sometitel2" class="sonra">title2</a></li>
      <li><a href="http://wantedlink3" rel="bookmark" title="sometitel3" class="sonra">title3</a></li>
      <li><a href="http://wantedlink4" rel="bookmark" title="sometitel4" class="sonra">title4</a></li>
      <li><a href="http://wantedlink5" rel="bookmark" title="sometitel5" class="sonra">title5</a></li>
      <li><a href="http://wantedlink6" rel="bookmark" title="sometitel6" class="sonra">title6</a></li>
      <li><a href="http://wantedlink7" rel="bookmark" title="sometitel7" class="sonra">title7</a></li>
      <li><a href="http://wantedlink8" rel="bookmark" title="sometitel8" class="sonra">title8</a></li>
      <li><a href="http://wantedlink9" rel="bookmark" title="sometitel9" class="sonra">title9</a></li>
      <li><a href="http://wantedlink10 " rel="bookmark" title="sometitel10" class="sonra">title10</a></li>

我想要得到的所有,只http://wantedlink1http://wantedlink10我尝试属性(“HREF”),但我得到的只有一个链接我要列出这样的所有链接:

http://wantedlink1 
http://wantedlink2 
http://wantedlink3 
.
. 
. 
http://wantedlink10

任何帮助?

har07

基本上,您可以将XPath更改为SelectNodes()选择单个<a>元素而不是<ul>然后从这一点开始,很容易遍历结果并href逐个获取属性。或者,您可以使用LINQ达到相同的目的,例如以下示例:

'select <a> elements'
Dim links = htmldoc.Document.SelectNodes("//*[@id='catlist-listview']/ul/li/a")
'project to IEnumerable of href attribute value'
Dim hrefs = links.Cast(Of HtmlNode)().Select(Function(x) x.GetAttributeValue("href", ""))
'join the `hrefs`, separated by newline, into one string'
textbox3.text = String.Join(Environment.NewLine, hrefs)

dotnetfiddle demo

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在VB.NET中获取CheckBoxList的所有选定值

来自分类Dev

使用反射将类中的所有静态属性作为对象获取VB.NET

来自分类Dev

在VB.Net中使用HtmlAgilityPack从网站获取文本

来自分类Dev

如何使用VB.NET从XML获取属性值?

来自分类Dev

SQL获取具有值VB.net的所有行

来自分类Dev

在VB.Net中获取ListView的特定列中所有值的总和

来自分类Dev

在VB.Net中获取ListView的特定列中所有值的总和

来自分类Dev

VB.NET和HtmlAgilityPack解析元素属性

来自分类Dev

vb.net从数据库获取所有行

来自分类Dev

在vb.net项目中获取所有表格的标题

来自分类Dev

获取所有组合框名称 VB.NET

来自分类Dev

vb.net 检查所有行包含值

来自分类Dev

使用VB.Net获取实现特定接口的所有类类型

来自分类Dev

使用vb.net如何在选择下拉列表中获取所有选项(Webbrowser)

来自分类Dev

vb.net 列出带有值的类属性

来自分类Dev

如何使用VB.net计算XML中具有相同属性值的节点总数

来自分类Dev

vb.net不会使用htmlagilitypack检索数据

来自分类Dev

vb.net如何使用htmlagilitypack获得<strong>的价值

来自分类Dev

无法设置属性值VB.NET

来自分类Dev

如何使用VB.NET在JSON的值中获取值

来自分类Dev

从值获取VB.net枚举说明

来自分类Dev

获取特定div vb.net的值

来自分类Dev

每行的Vb.net HTMLAgilityPack循环

来自分类Dev

使用数组VB .net的多个属性

来自分类Dev

VB.NET查找带有custon标记的所有属性

来自分类Dev

VB.NET抽象属性

来自分类Dev

以相同的形式VB.NET更改所有文本框的属性

来自分类Dev

在VB.NET中从客户端循环遍历动态JSON对象中的所有属性

来自分类Dev

VB.NET和VB之间的区别