我需要解析HTML,但是有问题。
我需要从此html代码中获取imgSRC
和text
<div class="div1Class">
<div id="div1ID">
<div class="div3Class">
<ul>
<li>
<img src="imgSRC"/>
<div>
<h3 class="subject">text</h3>
</div>
</li>
</ul>
</div>
</div>
</div>
我尝试了HtmlAgilityPack
他们DocumentNode
,但是我不知道它是如何工作的。
预先感谢。
对于上述的html,您可以使用以下代码:
HtmlDocument document = new HtmlDocument();
//your html stream
document.Load(stream);
var container = document.DocumentNode.Descendants("div").FirstOrDefault(x => x.Attributes.Contains("class") && x.Attributes["class"].Value == "div3Class");
if (container != null)
{
var image = container.Descendants("img").FirstOrDefault(x => x.Attributes.Contains("src"));
if (image != null)
{
var imageSrcValue = image.Attributes["src"].Value;
}
var subjectItem = container.Descendants("h3").FirstOrDefault(x => x.Attributes.Contains("class") && x.Attributes["class"].Value == "subject");
if (subjectItem != null)
{
var subjectItemValue = subjectItem.InnerText;
}
}
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句