我正在尝试使用C#应用程序提取给定URL的源页面。现在我正在上课HttpWebRequest
。
奇怪的是,与使用Google Chrome浏览器(Ctrl + u)获得的页面相比,从此类获得的结果页面是完全不同的。
有人可以告诉我如何获取确切的源页面。还是期望两个页面相等是错误的?
非常感谢
尽管可以从Internet上正确检索html,但使用Web浏览器可能很简单。该代码将要求您调用另一个void或将代码放在事件中。
WebBrowser wb = new WebBrowser();
private void button1_Click(object sender, EventArgs e) {
wb.Navigate("http://kissanime.com/Anime/One-Piece");
wb.ScriptSupress = true;
wb.DocumentCompleted += pageLoaded;
}
private void pageLoaded(object sender, WebBrowserDocumentCompletedEventArgs e) {
string src = wb.DocumentText;
}
通过使用该方法,您将直接从Web浏览器中获取html,尽管加载该页面需要花费时间,具体取决于页面的大小,图像和依赖项(外部文件,如JS,CSS和图片/视频)。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句