検索

検索

ウェブページが完全に読み込まれるまでに遅延が必要なURLからHTMLコードを取得する

debugcn 投稿 Dev

2

bpheazye

RでgetURLContent（）またはHTMLParse（）を使用して、Webサイトからhtmlを取得しようとしています。問題は、ページの読み込みが遅く、いくつかのチャンクになっていることです。

これらのオプションは両方とも、Webページの最初のチャンクがロードされた後に停止してコードを返すようです。これにより、HTMLには、さらに5〜10秒で読み込まれるものの大部分が失われます。

解析を開始する方法が必要ですが、ページの読み込み時間を確保するために、実行中に解析を遅らせる必要があります。私はこれらの2つのオプションに関する文献を調査しましたが、それを行うためのオプションは見つかりませんでした。

誰かがこの問題の可能性または回避策の可能性を知っていますか？

ありがとうございました！

ちょうび

通常、この問題はAjaxを使用するページから発生します（ページを複数回ロードします）。これ以上の情報がないとわかりにくい。

通常機能する1つの解決策は、Firefox / Explorer / Chromeページを開くことにより、「実際の」ユーザーを模倣するRSeleniumを使用することです。

# selenium proper
library(RSelenium)
# rvest to convert to xml for easier parsing
library(rvest)

# start a server and open a navigator (firefox by default)
startServer()
driver <- remoteDriver()
driver$open()

# go to google
driver$navigate("http://www.google.com")

# get source code
page <- driver$getPageSource()

# convert to xml for easier parsing
page_xml <- read_html(page[[1]])

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-07-13

0

コメントを追加

0

サインイン

関連記事

分類Dev

異なるページが遅延してdivに読み込まれる

分類Dev

Pyserialを使用すると、Serialクラスがインスタンス化されてからSerialオブジェクトがデータの書き込みに使用されるまでに遅延が必要になるのはなぜですか？

分類Dev

ページが完全に読み込まれた後にinnerHTMLを取得する

分類Dev

ページがwebdriverjsで完全に読み込まれるのを待ちます

分類Dev

ページが完全に読み込まれるまでgifを読み込みます

分類Dev

ページが完全に読み込まれるまでgifを読み込んでいます

分類Dev

ウェブサイトが読み込まれたときにサーバーから画像を取得する

分類Dev

ページが完全に読み込まれたときにHTMLコンテンツを変更する方法

分類Dev

遅延読み込みを含むDOMが完全に読み込まれるときのドキュメントリスナーを追加します

分類Dev

ページがcodeigniterに完全に読み込まれないようにする

分類Dev

ページが読み込まれてから2秒後にdivを表示する必要があります

分類Dev

ウェブページがGoogleChromeに読み込まれないようにするにはどうすればよいですか？

分類Dev

ウェブページがGoogleChromeに読み込まれないようにするにはどうすればよいですか？

分類Dev

ページが完全に読み込まれた後にウィンドウを閉じる

分類Dev

ページの読み込み時にphpコードが読み込まれないようにすることは可能ですか？

分類Dev

WebClientでダウンロードする前に、ページが読み込まれるのを待ちます

分類Dev

AOTを使用してプロジェクトをビルドすると、実行時にカスタムライブラリからのAngular8遅延読み込みルートが壊れます

分類Dev

ウェブサイトが最初に読み込まれてページの下部に表示されるのはなぜですか？

分類Dev

Chrome prerender: ページが実際に読み込まれるまで JavaScript を遅らせる方法は?

分類Dev

ウェブページが完全に読み込まれる前にChromeにデータのPOSTを許可するにはどうすればよいですか？

分類Dev

ページが完全に読み込まれた後にプリフェッチをトリガーする

分類Dev

Chrome拡張機能、ページが完全に読み込まれるまでスクリプトを遅らせる方法

分類Dev

ウェブページのボタンを押すと、GoogleChromeに新しいURLが読み込まれます

分類Dev

メインページにウィジェットが増えると、ワードプレスでの読み込みが悪くなりますか?

分類Dev

プリローダーに遅延を追加して、ページが数秒間読み込まれた後でもプリローダーが表示されるようにするにはどうすればよいですか？

分類Dev

Googleクローラーは、遅延スクリプトによってページが読み込まれた後に挿入されたJSON-LDを読み取ることができますか？

分類Dev

ページが完全に読み込まれた後、コードビハインドからアラートを表示するにはどうすればよいですか？

分類Dev

jqueryでページが読み込まれるときにドロップダウンからオプションを設定します

分類Dev

HTMLページ全体が読み込まれるまで読み込み中のgifを表示するにはどうすればよいですか？

Related 関連記事

記事

ホットタグ

アーカイブ