BeautifulSoupを使用してWebページから損益計算書をダウンロードし、Pandasデータフレームに変換しますか？

debugcn 投稿 Dev

アーサー法

マクドナルドコーポレーション（MCD）の損益計算書の表「https://finance.yahoo.com/quote/MCD/financials?p=MCD」を取得しようとしています。美味しいスープを使いました。htmlはダウンロードされますが、損益計算書テーブルに一般的な「tr」、「td」タグがないようです。損益計算書の表をdfデータフレームに変換する方法は？

私のコード：

url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"


src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup)

array = []
for tr_tag in soup.find_all('tr'):
    b_tag = tr_tag.find_all('td')
    array.append(b_tag)
print(array)

gmdev

「BeautifulSoupを使用してWebページから損益計算書をダウンロード...」

まず、あなたは言いsoup.find_all('tr')ます; ただし、tr損益計算書の表にはタグがありません。Webサイトでは、各行にdiv特定のが付いたタグがありclassます。を指定するとclass、Webサイトから必要なものをプログラムに正確に伝えることができます。私が使用されるdiv classが、テーブルの各列を横切って一貫しているため、「H D（TBR）FI-行BGC（$ hoverBgColor）」の。次に、このtext関数を使用して、の代わりにWebサイトから生のテキストを取得できますHTML。

url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"

src = result.content
soup = BeautifulSoup(src, 'lxml')

rows = []
for i in soup.find_all('div',{'class':'D(tbr) fi-row Bgc($hoverBgColor):h'}):
    row = i.text
    rows.append(row)

print(rows)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-12

コメントを追加

サインイン

Related 関連記事

記事