<td style="text-align: center;"><a title="Some title" href="https://www.blabla.com">Testing</a></td>
タグの子であるBeautifulSoup
すべてhref
のa
タグを取得するために使用しようとしていますtd
。
走れる
urls = [x for x in soup.findAll("td")]
すべてのtd
タグを取得してから手動でループして、a
タグが含まれているかどうかを確認し、含まれている場合はを抽出しますがhref
、これを1行で行うよりクリーンな方法はありますか?
:has()
CSSセレクターを使用td
して、タグを持つすべてのタグを選択してみてください<a>
。
from bs4 import BeautifulSoup
html = """<td style="text-align: center;"><a title="Some title" href="https://www.blabla.com">Testing</a></td>"""
soup = BeautifulSoup(html, "html.parser")
print([tag.find("a")["href"] for tag in soup.select("td:has(a)")])
出力:
['https://www.blabla.com']
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加