マクドナルドコーポレーション(MCD)の損益計算書の表「https://finance.yahoo.com/quote/MCD/financials?p=MCD」を取得しようとしています。美味しいスープを使いました。htmlはダウンロードされますが、損益計算書テーブルに一般的な「tr」、「td」タグがないようです。損益計算書の表をdfデータフレームに変換する方法は?
私のコード:
url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"
src = result.content
soup = BeautifulSoup(src, 'lxml')
print(soup)
array = []
for tr_tag in soup.find_all('tr'):
b_tag = tr_tag.find_all('td')
array.append(b_tag)
print(array)
「BeautifulSoupを使用してWebページから損益計算書をダウンロード...」
まず、あなたは言いsoup.find_all('tr')
ます; ただし、tr
損益計算書の表にはタグがありません。Webサイトでは、各行にdiv
特定のが付いたタグがありclass
ます。を指定するとclass
、Webサイトから必要なものをプログラムに正確に伝えることができます。私が使用されるdiv class
が、テーブルの各列を横切って一貫しているため、「H D(TBR)FI-行BGC($ hoverBgColor)」の。次に、このtext
関数を使用して、の代わりにWebサイトから生のテキストを取得できますHTML
。
url="https://finance.yahoo.com/quote/MCD/financials?p=MCD"
result = requests.get(url)
result.raise_for_status()
result.encoding = "utf-8"
src = result.content
soup = BeautifulSoup(src, 'lxml')
rows = []
for i in soup.find_all('div',{'class':'D(tbr) fi-row Bgc($hoverBgColor):h'}):
row = i.text
rows.append(row)
print(rows)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加