パブリックタブローダッシュボードをスクレイプする方法は？

debugcn 投稿 Dev

パトリック・リベイロ・マイア

毎日、公開されているTableauダッシュボードで利用可能なデータをダウンロードする必要があります。対象のパラメーター（時系列頻度、時系列間隔など）を定義した後、ダッシュボードでシリーズをダウンロードできます。

PythonまたはRを使用して、これらのシリーズのデータベースへのダウンロードを自動化できれば、私の生活はかなり楽になります。ページで行われたリクエストを分析しようとしましたが、それ以上進むことはできませんでした。このプロセスを自動化する方法はありますか？

ダッシュボード：https：//tableau.ons.org.br/t/ONS_Publico/views/DemandaMxima/HistricoDemandaMxima？：embed = y＆：showAppBanner = false＆：showShareOptions = true＆：display_count = no＆：showVizHome = no

ベルトランマーテル

この答えは、に似ているこのいずれかが、最初のURLのページやタブローのベースURLが異なります。プロセス/アルゴリズムは基本的に同じですが、手順を詳しく説明します。

グラフィックは、APIの結果からJSで生成されます。

POST https://tableau.ons.org.br/ROOT_PATH/bootstrapSession/sessions/SESSION_ID

SESSION_IDパラメーターは、（とりわけ）tsConfigContaineriframeの構築に使用されるURLのtextareaにあります。

https://tableau.ons.org.br/t/ONS_Publico/views/DemandaMxima/HistricoDemandaMxima?:embed=y&:showAppBanner=false&:showShareOptions=true&:display_count=no&:showVizHome=noから開始：

tsConfigContainerたくさんのjson値を持つidのtextareaがあります
session_idおよびルートパスを抽出します（vizql_root）
上のPOSTにするhttps://tableau.ons.org.br/ROOT_PATH/bootstrapSession/sessions/SESSION_IDとsheetId、フォームデータ等を
結果からjsonを抽出します（結果はjsonではありません）

コード：

import requests
from bs4 import BeautifulSoup
import json
import re

url = "https://tableau.ons.org.br/t/ONS_Publico/views/DemandaMxima/HistricoDemandaMxima"

r = requests.get(
    url,
    params= {
        ":embed":"y",
        ":showAppBanner":"false",
        ":showShareOptions":"true",
        ":display_count":"no",
        "showVizHome": "no"
    }
)
soup = BeautifulSoup(r.text, "html.parser")

tableauData = json.loads(soup.find("textarea",{"id": "tsConfigContainer"}).text)

dataUrl = f'https://tableau.ons.org.br{tableauData["vizql_root"]}/bootstrapSession/sessions/{tableauData["sessionid"]}'

r = requests.post(dataUrl, data= {
    "sheet_id": tableauData["sheetId"],
})

dataReg = re.search('\d+;({.*})\d+;({.*})', r.text, re.MULTILINE)
info = json.loads(dataReg.group(1))
data = json.loads(dataReg.group(2))

print(data["secondaryInfo"]["presModelMap"]["dataDictionary"]["presModelHolder"]["genDataDictionaryPresModel"]["dataSegments"]["0"]["dataColumns"])

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

分類Dev

Related 関連記事

記事

パブリックタブローダッシュボードをスクレイプする方法は？

パブリックタブローダッシュボードをスクレイプする方法は？

RDWeb:「リモート PC に接続」のみのクリップボードとプリンターのリダイレクトをブロックする方法

Tableauパブリックダッシュボードからのスクレイピングデータ

アップロードをパブリック/アップロードにリダイレクトする

ボタンクリックでブートストラップドロップダウンメニューを閉じる方法は？

パンダ、マルチインデックスデータフレームでサブセットを使用して値をドロップする方法は？

ダッシュボードデスクトップレイアウトはレスポンシブですか？

busyboxシェルスクリプトで非ブロッキングモードで名前付きパイプ（FIFO）をフラッシュする方法は？

HoloViews / Bokehのプロット間にウィジェット（セレクター）とインタラクティブ機能（タップストリーム）を備えたダッシュボードを作成するにはどうすればよいですか？

ドロップダウンメニューボタンをクリックすると、リンクを開くブートストラップ

マウスクリックのハイパーリンクをシミュレートするポップアップウィンドウがブロックされ、タブで開かない

パスワードログインモーダルを作成する方法、送信ボタンをクリックし、ブートストラップ3を使用してリンクを含む別のモーダルを開きます

Yii2：アクティブなデータプロバイダーをキャッシュする方法は？

マップをクリックした後にのみデータがプロットに表示されるTableauダッシュボードをスクレイプするにはどうすればよいですか？

タイプスクリプトでフレームオブジェクトのキーストロークをシミュレートする方法は？（sendKeysメソッドを使用しないでください）

htaccessを使用して末尾のスラッシュの後にパラメータを使用してすべてのサブドメインを別のサブドメインにリダイレクトする方法は？

ブーストスレッドをブロックしてウェイクアップする方法は？

ブーストスレッドをブロックしてウェイクアップする方法は？

reactjsでダッシュボードへのログインリダイレクトを処理する方法

Apps Script：2つのボタンをクリックするだけでダイアログボックスをループでロードする方法は？

ネットワーク/コンピュータのパブリックIPアドレスをWebサイトに更新するプログラム

CrashlyticsのファブリックダッシュボードでAndroidアプリのパッケージ名を変更する方法

CrashlyticsのファブリックダッシュボードでAndroidアプリのパッケージ名を変更する方法

剣道UI：タブストリップのコンテンツは、ボタンをクリックすると同じタブストリップ内の別のビューにリダイレクトされる必要があります

ブートストラップボタンのドロップダウン子要素のクラスは、他のボタンのドロップダウンアイテムをクリックすると削除されます

リモートでマスターブランチへのプッシュをブロックする方法

KeystoneJSリストCSVのダウンロード/エクスポートでリレーションシップフィールドタイプのオブジェクトIDを名前/タイトルに置き換える方法は？

既存のレスポンシブナビゲーションメニューにドロップダウンリンクを追加する方法

ブートストラップ：モーダルからボックスシャドウを削除する方法は？

ブールインデックス付きのパンダデータフレーム（または他の高速ソリューション）からエッジリスト（itertoolsの組み合わせスタイル）をすばやく作成する方法は？