検索

検索

ウィキペディアの箇条書きリストから名前を抽出すると、各文字の名のみが返されます

debugcn 投稿 Dev

1

grmsport

次のウィキペディアのページからすべての名前を取得しようとしています：https：//ro.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti

これは私が実行しているコードです：

from bs4 import BeautifulSoup
import requests

url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find('a').text.upper() for x in soup.findAll('div', class_ = 'div-col columns column-count column-count-5')]
for i in wikiName:
    print(i)

私は絶対的な初心者であることをこの前置きにしたいと思います。の後class_に別の文字列を入力しようとしましたが、名前のリスト全体を返すものはありません。返される名前は、各文字の最初の名前だけです。

ADA
BEATRICE
CAMELIA
DACIANA
ECATERINA
FABIA
etc.

ページからすべての名前を取得するために私がしなければならないことを誰かが私に知らせてくれれば幸いです。事前にどうもありがとうございました！

ミッチェルオリスラガーズ

あなたはこれを試すことができます。find_allすべての名前を取得し、後でジャンクを除外するために使用します。

from bs4 import BeautifulSoup
import requests

url = 'https://ro.m.wikipedia.org/wiki/List%C4%83_de_prenume_rom%C3%A2ne%C8%99ti'

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')
wikiName = [x.find_all('a') for x in soup.find_all('div', class_ = 'div-col columns column-count column-count-5')]
for names in wikiName:
    print([name.text for name in names if name.text != 'wikt' and name.text != '@'])

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-15

0

コメントを追加

0

サインイン

関連記事

分類Dev

wpfのテキストバインディングの前に箇条書きを追加するにはどうすればよいですか？

分類Dev

名前にスペースが含まれるディレクトリを含め、ディレクトリのみを一覧表示しますか？

分類Dev

カスタム箇条書きを使用するときに折り返されるliテキストの整列

分類Dev

文字列をリストに分割すると、アルファベット順の箇条書きリストが含まれます

分類Dev

名前リスト内の各名前が繰り返される回数をカウントするにはどうすればよいですか？

分類Dev

ウィキペディアAPIからJSONなしのウィキテキストのみを取得する

分類Dev

辞書のキーとしてディレクトリからファイルの名前を保存するにはどうすればよいですか？

分類Dev

最後の箇条書き/番号を壊さずに、番号付きリストの箇条書きの最後の行から段落記号を削除します

分類Dev

Python 3.6を使用して、ウィキペディアカテゴリの関連するすべてのページからすべてのサブカテゴリ名を取得して抽出するにはどうすればよいですか？

分類Dev

Python 3.6を使用して、ウィキペディアカテゴリの関連するすべてのページからすべてのサブカテゴリ名を取得して抽出するにはどうすればよいですか？

分類Dev

このスクリプトが名前がスペースで終わるディレクトリを見つけられないのはなぜですか

分類Dev

ウィキペディアAPIを使用して、同じ名前の人に関するページリストで特定の人を見つける方法

分類Dev

同じカテゴリ名を持つウィキペディアの名前付きエンティティを処理する方法

分類Dev

緩く構造化されたウィキペディアのテキストを抽出します。html

分類Dev

VBAの電子メール本文内のHTML箇条書きリストにパディングを追加するにはどうすればよいですか？

分類Dev

すべてのリストアイテムを削除しながら最初の箇条書きを削除するにはどうすればよいですか？

分類Dev

テキストの前に表示されるすべてのハイパーリンクを削除します（ウィキペディアダンプ）

分類Dev

dfコマンドからマウントされたディスクの名前を取得する方法

分類Dev

LinqからNHibernateは、名前が文字列リストの内容で始まるエンティティを返します

分類Dev

jsonサービスからW \ u0119 \ u017car \ u00f3wとして返されるポーランド語の名前（Wężarów）は、WÄ™Å¼arÃ³wとしてレンダリングされます。エンコーディング/文字セットを理解できません。

分類Dev

リクエストを使用して各結果の内部ページから名前をこすることができません

分類Dev

リストアイテムの箇条書きがフローティング要素と重なるのはなぜですか

分類Dev

多くの辞書があるリストから各プレーヤーのハイスコアを取得するにはどうすればよいですか？各辞書は名前とスコアです

分類Dev

名前にスペースが含まれるディレクトリ名のエイリアス

分類Dev

別のディレクトリからzipファイルを抽出すると、zipファイルの名前（App1.zipなど）がコピーされますが、App1にzipは必要ありません

分類Dev

ネストされた辞書キーを作成し、名前空間のキーと値のペアのリストから値を割り当てるにはどうすればよいですか？

分類Dev

名前にスペースが含まれているファイルやディレクトリがbashで無視されるのはなぜですか？

分類Dev

mysqlからGETリクエストを実行すると、スペースの前の最初の単語のみが返されます

分類Dev

Wordからプレーンテキストにコピーして貼り付けるときに、ネストされた箇条書きリストのインデントを保持する

Related 関連記事

記事

ホットタグ

アーカイブ