別のアプリケーションのWebブラウザコントロールからドキュメント情報(またはドキュメントテキスト)を取得する(場合によっては変更する)方法を探しています。他のアプリケーションは.netで書かれていますが、私は書いていません。
私はこのような能力を探しています:
Webを検索すると、「フック」を使用するようになりましたが、この状況でフックを使用することはあまりありません。
あなたが
アンソニーを助けてくれることを願っています
このコードは、プレーンテキストを返すhtml解析の例を提供します(解析はページのコンテンツによって異なります)。
private string GetPlainText(WebBrowser webBrowser)
{
StringBuilder sb = new StringBuilder();
// Pick out a heading.
foreach (HtmlElement h1 in webBrowser.Document.GetElementsByTagName("H1"))
sb.Append(h1.InnerText + ". ");
// Select only some text, ignoring everything else.
foreach (HtmlElement div in webBrowser.Document.GetElementsByTagName("DIV"))
if (div.GetAttribute("classname") == "story-body")
foreach (HtmlElement p in div.GetElementsByTagName("P"))
{
string classname = p.GetAttribute("classname");
if (classname == "introduction" || classname == "") sb.Append(p.InnerText + " ");
}
return sb.ToString();
}
}
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加