美しいスープでJavascriptを解析するPython

カイル

JavaScript内のコンテンツを解析しようとしています。私はそれをどのように行うかについての考えを持っていますが、私は完全に確信していません。私はいくつかの例を読みましたが、reライブラリを使用するのが良い方法かもしれないと思っています。

これまでの私のコードは次のとおりです。

import requests
import json
import re
from bs4 import BeautifulSoup

url = r'https://login.live.com/login.srf?wa=wsignin1.0&rpsnv=13&rver=6.7.6643.0&wp=MBI_SSL&wreply=https:%2f%2faccount.xbox.com%2fen-us%2faccountcreation%3freturnUrl%3dhttps:%252f%252fwww.xbox.com:443%252fen-US%252f%26pcexp%3dtrue%26uictx%3dme%26rtc%3d1&lc=1033&id=292543&aadredir=1'


s = requests.Session()


soup = BeautifulSoup(s.get(url).content, 'html.parser')


print(soup.find_all("script", type="text/javascript")[5].prettify())

これは、解析されたコンテンツのほんの一部です。私はこのデータ、特に「価値」にアクセスしようとしています

<input type="hidden" name="PPFT" id="i0327" value="Dd**Lkp2L3EKDvGi3u6PEweEQUhvW*1jPrA3FgGSdeYoY8FERluiTqDef6QF3V5NkN*4yPg7vvxI3jo5oKPRelhfU3rYGFkxbxyvSBssiwFA!8LwocAbVDtrDq11Wk3F4LzRBQck3H4ca5r3Qhv8b0h4CxcEZgAnGAkcWE7fExGn1dBwGoY8sZVL2!ZBMjnJEanidLF!Yi975frkQ6Cys2oUb863xoLxdvZGuLQRxRLjjKubaCHlWQbD0b*Wzq49EA$$"/>

よろしくお願いします。ありがとう!

カミカゼ_金魚
from bs4 import BeautifulSoup as bs
import requests
import re
url = 'https://login.live.com/login.srf?wa=wsignin1.0&rpsnv=13&rver=6.7.6643.0&wp=MBI_SSL&wreply=https:%2f%2faccount.xbox.com%2fen-us%2faccountcreation%3freturnUrl%3dhttps:%252f%252fwww.xbox.com:443%252fen-US%252f%26pcexp%3dtrue%26uictx%3dme%26rtc%3d1&lc=1033&id=292543&aadredir=1'
page = requests.get(url)
html = bs(page.text, 'lxml')
input = html.findAll('script', type="text/javascript")[5].prettify()
value = re.findall(r'value=".+"/', input)
#value = str(value).replace('value="', '').replace('"/','')
value = str(value).replace('value="', '').replace('"/','').replace("['",'').replace("']",'')
print(value)
Output:
DVSXQahhtomXS2Y4k2itS5MPP52mJgUkC7LH!W*1DmjHiWk*npajBfgXK5yp3*!bu3Wuvvs7xavleUV3nIbjLZHckj73QMe8wipwXhCqpXuUZQ2wnJvNYAVNCg9XxKPuIovp7!sLbumrufuYefyzM6UQLkMb5c7MuImDofVhLlKxpI7Pohe8sO2x8r63TtFCTDphWzqXKJE3B8DRK*AhMbFsmdP0sj2CXMZ7dyTfLJSr1zWBlaHTqJPLvhgzLSiaEg$$

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Pythonの美しいスープでNBAリファレンスを解析する

分類Dev

美しいスープで KML を解析する

分類Dev

美しいスープでスクリプトを解析する方法は?

分類Dev

美しいスープpython3を使用してAutosarxmlを解析する

分類Dev

美しいスープでGoogleのインナーカードを解析する

分類Dev

美しいスープでデータテーブルを解析する

分類Dev

Python Webscraping:美しいスープ/リクエストで漢字を解析する際の問題

分類Dev

美しいスープで深く解析する

分類Dev

美しいスープ:1つの要素のみを解析する

分類Dev

XMLを解析する美しいスープ

分類Dev

Pythonで美しいスープを使用してテーブルをこする

分類Dev

美しいスープを使用してPythonで `h1id`を取得する

分類Dev

美しいスープでデータを解析し、データ属性をターゲットにする

分類Dev

美しいスープを使用してhtmlテーブルを解析する

分類Dev

python3で美しいスープをインポートする

分類Dev

美しいスープとpython3.xでテーブルをこする

分類Dev

json でクロールする python 美しいスープ Web

分類Dev

美しいスープでスキーマをこする?

分類Dev

Pythonでの美しいスープXML解析の問題

分類Dev

美しいスープでラムダ関数を使用する

分類Dev

美しいスープでラムダ関数を使用する

分類Dev

美しいスープで現場をこする

分類Dev

美しいスープで特定の要素を選択する方法

分類Dev

美しいスープでCSVファイルを作成する

分類Dev

美しいスープでCSVファイルを作成する

分類Dev

美しいスープで特定のリンクを抽出する

分類Dev

美しいスープ:cerean属性でxml値を抽出する

分類Dev

美しいスープで<スパン>をスキップする方法

分類Dev

美しいスープパイソンを使用してグーグルニュースを解析する

Related 関連記事

  1. 1

    Pythonの美しいスープでNBAリファレンスを解析する

  2. 2

    美しいスープで KML を解析する

  3. 3

    美しいスープでスクリプトを解析する方法は?

  4. 4

    美しいスープpython3を使用してAutosarxmlを解析する

  5. 5

    美しいスープでGoogleのインナーカードを解析する

  6. 6

    美しいスープでデータテーブルを解析する

  7. 7

    Python Webscraping:美しいスープ/リクエストで漢字を解析する際の問題

  8. 8

    美しいスープで深く解析する

  9. 9

    美しいスープ:1つの要素のみを解析する

  10. 10

    XMLを解析する美しいスープ

  11. 11

    Pythonで美しいスープを使用してテーブルをこする

  12. 12

    美しいスープを使用してPythonで `h1id`を取得する

  13. 13

    美しいスープでデータを解析し、データ属性をターゲットにする

  14. 14

    美しいスープを使用してhtmlテーブルを解析する

  15. 15

    python3で美しいスープをインポートする

  16. 16

    美しいスープとpython3.xでテーブルをこする

  17. 17

    json でクロールする python 美しいスープ Web

  18. 18

    美しいスープでスキーマをこする?

  19. 19

    Pythonでの美しいスープXML解析の問題

  20. 20

    美しいスープでラムダ関数を使用する

  21. 21

    美しいスープでラムダ関数を使用する

  22. 22

    美しいスープで現場をこする

  23. 23

    美しいスープで特定の要素を選択する方法

  24. 24

    美しいスープでCSVファイルを作成する

  25. 25

    美しいスープでCSVファイルを作成する

  26. 26

    美しいスープで特定のリンクを抽出する

  27. 27

    美しいスープ:cerean属性でxml値を抽出する

  28. 28

    美しいスープで<スパン>をスキップする方法

  29. 29

    美しいスープパイソンを使用してグーグルニュースを解析する

ホットタグ

アーカイブ