次のウィキペディアのページからすべての名前を取得しようとしています:https://ro.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti
これは私が実行しているコードです:
from bs4 import BeautifulSoup
import requests
url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find('a').text.upper() for x in soup.findAll('div', class_ = 'div-col columns column-count column-count-5')]
for i in wikiName:
print(i)
私は絶対的な初心者であることをこの前置きにしたいと思います。の後class_
に別の文字列を入力しようとしましたが、名前のリスト全体を返すものはありません。返される名前は、各文字の最初の名前だけです。
ADA
BEATRICE
CAMELIA
DACIANA
ECATERINA
FABIA
etc.
ページからすべての名前を取得するために私がしなければならないことを誰かが私に知らせてくれれば幸いです。事前にどうもありがとうございました!
あなたはこれを試すことができます。find_all
すべての名前を取得し、後でジャンクを除外するために使用します。
from bs4 import BeautifulSoup
import requests
url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find_all('a') for x in soup.find_all('div', class_ = 'div-col columns column-count column-count-5')]
for names in wikiName:
print([name.text for name in names if name.text != 'wikt' and name.text != '@'])
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加