我正在尝试从下面的维基百科页面中获取所有名称:https : //ro.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti
这是我正在运行的代码:
from bs4 import BeautifulSoup
import requests
url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find('a').text.upper() for x in soup.findAll('div', class_ = 'div-col columns column-count column-count-5')]
for i in wikiName:
print(i)
我想以绝对的新手开头。我尝试在之后输入不同的字符串class_
,但是没有任何东西返回名称的完整列表。返回的唯一名称是每个字母的名字:
ADA
BEATRICE
CAMELIA
DACIANA
ECATERINA
FABIA
etc.
如果有人可以让我知道为了从页面获取所有名称该怎么做,我将不胜感激。提前非常感谢您!
你可以试试看 使用find_all
得到的所有名字,后来筛选出的垃圾。
from bs4 import BeautifulSoup
import requests
url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'
r = requests.get(url)
soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find_all('a') for x in soup.find_all('div', class_ = 'div-col columns column-count column-count-5')]
for names in wikiName:
print([name.text for name in names if name.text != 'wikt' and name.text != '@'])
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句