https://www.eurocontrol.int/Economics/DailyTrafficVariation-States.htmlのようなインタラクティブなJSグラフから抽出できるかどうか知りたいです。
ここでの問題は、必要なデータを取得するために、最初に最初のテーブルで灰色のバーを選択して、必要な2番目のテーブルを生成する必要があることです。
毎日の航空交通の最初のテーブルは、必要なパーセントデータを含む2番目のテーブルを生成します
また、4か国で表示されるパーセンテージのみを抽出したい。
いくつかのPythonパッケージを試しましたが、インタラクティブなJSグラフにはそれほど効果的ではありませんでした。ほとんどは、ウィキペディアにあるような静的テーブルにのみ適しているようです。BeautifulSoup、Pandas、Requests、およびSelenium Webページを調べてxhrデータを確認し、csvファイルが添付されているかどうかを調べました。データを抽出するためにインタラクティブなJSグラフをキャプチャしたものはありません。
出来ますか?それをExcelにダウンロードできますか?
ありがとう!
javascriptをレンダリングして実行できるツールを使用する必要があります。それは基本的にウェブブラウザを意味します。Firefoxをベースにしたものもあれば、Chromeをベースにしたものもあります。
あなたが提供したリンクを考えると、GoogleのPuppeteer(https://pptr.dev/)で必要なことを実行できると思います。
しかし、あなたはウェブサイトをスクレイピングすることの複雑さを過小評価しているように私には思えます。多くの困難を克服する準備をしてください。最も重要なのは、データをスクレイピングするのが嫌いで、抜本的な対策を講じているサイトです。このアプローチは、おそらく数ページをスクレイプするのに役立ちますが、多くのデータはほとんどありません。
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加