HTMLノードを生成するJavaScriptファイルを返すajaxページのスクレイピング

yayu

一部のページは、ajaxで生データ(json、xml、htmlなど)を返しません。代わりに、ajax呼び出しが何らかの形でhtmlノードにデータを取り込むjsファイルを返すdojoのようなフレームワークを使用します。

これらのページからデータをスクレイプするための非Selenium戦略があるかどうか疑問に思っています。

alecxe

seleniumまたはwebkitベースのアプローチの代わりに、のようなjavascriptコードパーサーを使用してjavascriptを解析できますslimitむき出しのハードコアメタルに取り掛かるので、ウェブスクレイピングの複雑さと信頼性が確実に高まります。seleniumベースの高レベルの「ブラックボックス」アプローチではなく、「ホワイトボックス」アプローチと考えてください。

これがあなたが尋ねているのとまったく同じトピック/問題に対して私が与えた答えです:

これには、slimitJavaScriptコードからオブジェクトを取得し、jsonモジュールを介してPythonデータ構造にロードし、BeautifulSoupパーサーを使用して内部のHTMLを解析するための使用が含まれます

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

複雑なノード構造(htmlノード)でページをスクレイピングするrvestメール

分類Dev

スクレイピングのキーワードでHTMLファイルを分離する

分類Dev

HTMLページをJavascriptでExcelにスクレイピングする

分類Dev

ajaxを使用するWebページのスクレイピング

分類Dev

Facebookのファンページの数値IDをすばやく大量にスクレイピングする

分類Dev

ウェブページのグリッド内でJavaScriptデータをスクレイピングする

分類Dev

JavaScriptでレンダリングされたHTMLページをPythonでスクレイピングする

分類Dev

空のjsonファイルを返すスクレイピー

分類Dev

特定の行以降のHTMLファイルのデータをスクレイピングする方法

分類Dev

バックエンドのjsonデータファイルを使用するPythonWebスクレイピング

分類Dev

ドライスクレイプで react.js の Web ページをスクレイピングする

分類Dev

Scrapyで複数のページをスクレイピングする1つの辞書を返す

分類Dev

HTMLページからPythonピクルスファイルを提供する方法

分類Dev

ページをスクレイピングしてもすべてのHTMLが返されない

分類Dev

Pythonを使用して、複数の動的選択フィールドを持つページからデータをスクレイピングする方法は?

分類Dev

ホスティング(ファイルマネージャー)ディレクトリのindex.htmlからページをリンクする

分類Dev

スクレイピングされたイメージの場所をDBに保存する-ノード/平均

分類Dev

PHPでページをスクレイピングする

分類Dev

javascriptでページ内のすべてのリンクをスクレイピングする方法

分類Dev

javascript効果でページをスクレイピングする方法

分類Dev

すべてのページをスクレイピング

分類Dev

すべてのページをスクレイピング

分類Dev

空のフィールドをスクレイピングする

分類Dev

ノード内の値のためにhtmlノードをスクレイピングしますか?

分類Dev

Rでソースhtmlではなく実際のページをスクレイピングする画面

分類Dev

HTMLページのJavascriptからデータをスクレイピング

分類Dev

BeautifulSoupを使用して複数のテーブルを含むページをスクレイピングする

分類Dev

nodejsとpuppeteerを使用してウィキペディアのページからフィルモグラフィーをスクレイピングする

分類Dev

画像のsrcのWebページをスクレイピングする方法は?

Related 関連記事

  1. 1

    複雑なノード構造(htmlノード)でページをスクレイピングするrvestメール

  2. 2

    スクレイピングのキーワードでHTMLファイルを分離する

  3. 3

    HTMLページをJavascriptでExcelにスクレイピングする

  4. 4

    ajaxを使用するWebページのスクレイピング

  5. 5

    Facebookのファンページの数値IDをすばやく大量にスクレイピングする

  6. 6

    ウェブページのグリッド内でJavaScriptデータをスクレイピングする

  7. 7

    JavaScriptでレンダリングされたHTMLページをPythonでスクレイピングする

  8. 8

    空のjsonファイルを返すスクレイピー

  9. 9

    特定の行以降のHTMLファイルのデータをスクレイピングする方法

  10. 10

    バックエンドのjsonデータファイルを使用するPythonWebスクレイピング

  11. 11

    ドライスクレイプで react.js の Web ページをスクレイピングする

  12. 12

    Scrapyで複数のページをスクレイピングする1つの辞書を返す

  13. 13

    HTMLページからPythonピクルスファイルを提供する方法

  14. 14

    ページをスクレイピングしてもすべてのHTMLが返されない

  15. 15

    Pythonを使用して、複数の動的選択フィールドを持つページからデータをスクレイピングする方法は?

  16. 16

    ホスティング(ファイルマネージャー)ディレクトリのindex.htmlからページをリンクする

  17. 17

    スクレイピングされたイメージの場所をDBに保存する-ノード/平均

  18. 18

    PHPでページをスクレイピングする

  19. 19

    javascriptでページ内のすべてのリンクをスクレイピングする方法

  20. 20

    javascript効果でページをスクレイピングする方法

  21. 21

    すべてのページをスクレイピング

  22. 22

    すべてのページをスクレイピング

  23. 23

    空のフィールドをスクレイピングする

  24. 24

    ノード内の値のためにhtmlノードをスクレイピングしますか?

  25. 25

    Rでソースhtmlではなく実際のページをスクレイピングする画面

  26. 26

    HTMLページのJavascriptからデータをスクレイピング

  27. 27

    BeautifulSoupを使用して複数のテーブルを含むページをスクレイピングする

  28. 28

    nodejsとpuppeteerを使用してウィキペディアのページからフィルモグラフィーをスクレイピングする

  29. 29

    画像のsrcのWebページをスクレイピングする方法は?

ホットタグ

アーカイブ