BeautifulSoupを使用してWebページから損益計算書をダウンロードし、Pandasデータフレームに変換しますか?

アーサー法

マクドナルドコーポレーション(MCD)の損益計算書の表「https://finance.yahoo.com/quote/MCD/financials?p=MCDを取得しようとしています美味しいスープを使いました。htmlはダウンロードされますが、損益計算書テーブルに一般的な「tr」、「td」タグがないようです。損益計算書の表をdfデータフレームに変換する方法は?

私のコード:

url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"


src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup)

array = []
for tr_tag in soup.find_all('tr'):
    b_tag = tr_tag.find_all('td')
    array.append(b_tag)
print(array)
gmdev

「BeautifulSoupを使用してWebページから損益計算書をダウンロード...」

まず、あなたは言いsoup.find_all('tr')ます; ただし、tr損益計算書の表にはタグがありませんWebサイトでは、各行にdiv特定のが付いたタグがありclassます。を指定するとclass、Webサイトから必要なものをプログラムに正確に伝えることができます。私が使用されるdiv classが、テーブルの各列を横切って一貫しているため、「H D(TBR)FI-行BGC($ hoverBgColor)」の。次に、このtext関数を使用して、の代わりにWebサイトから生のテキストを取得できますHTML

url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"

src = result.content
soup = BeautifulSoup(src, 'lxml')

rows = []
for i in soup.find_all('div',{'class':'D(tbr) fi-row Bgc($hoverBgColor):h'}):
    row = i.text
    rows.append(row)

print(rows)

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

Related 関連記事

ホットタグ

アーカイブ