Pyhthonbs4が迷子のテキストを取得する

デイビス
    <li><a class="atc-group atc-group-active" href="" data-url="/atc-kodlari/1">
                                    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>

                                    <span class="lists-rundown-no">(16)</span>
                                </a>
    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>




<span class="lists-rundown-no">(16)</span>
<a class="atc-group atc-group-active" href="" data-url="/atc-kodlari/1">
                                    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>
                                    HERE!!
                                    <span class="lists-rundown-no">(16)</span>
                                </a></li>

ここに書かれている部分に参加する必要があります!! Pythonで美しいスープを使用していますが、それは漂遊テキストであるため、セレクターなどはありません。それを取得することは可能ですか?

私が試したこと。

import requests
from bs4 import BeautifulSoup

r = requests.get('anywebsite')
source = BeautifulSoup(r.content,"lxml")

for child in source.select("#atc-wrapper > ul"):
    for child2 in child.findChildren():
        print(child2)
アンドレイ・ケセリー

CSSセレクターa:last-of-type i使用し<i>て、最後の要素内の要素を選択できます<a>次にfind_next()、パラメータで使用しますtext=True

data = '''    <li><a class="atc-group atc-group-active" href="" data-url="/atc-kodlari/1">
                                    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>
                                    A - Gastrointestinal kanal ve metabolizma
                                    <span class="lists-rundown-no">(16)</span>
                                </a>
    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>


                                    A - Gastrointestinal kanal ve metabolizma

<span class="lists-rundown-no">(16)</span>
<a class="atc-group atc-group-active" href="" data-url="/atc-kodlari/1">
                                    <i class="fa fa-lg fa-pulse fa-spinner atc-group-loading" style="margin-right: 5px; display: none;"></i>
                                    HERE!!
                                    <span class="lists-rundown-no">(16)</span>
                                </a></li>'''

from bs4 import BeautifulSoup

soup = BeautifulSoup(data, 'lxml')

# select last i
i = soup.select_one('a:last-of-type i')

# select next text
print(i.find_next(text=True).strip())

プリント:

HERE!!

参考文献:

CSSセレクターリファレンス

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

子供のテキストを取得する jQuery コード

分類Dev

子要素のテキストを取得する方法

分類Dev

子が含まれているdivからテキストを取得する方法

分類Dev

Node.getTextContent()は、子孫のテキストではなく、現在のノードのテキストコンテンツを取得する方法があります

分類Dev

<br/> python / bs4の前にテキストを取得する

分類Dev

if / elseステートメントを実行して迷子になる

分類Dev

子要素のテキストを含めずに、Selenium WebDriverで要素のテキストを取得する方法は?

分類Dev

親要素のテキストを取得し、子要素のテキストを削除する方法selenium c#?

分類Dev

内部の子タグのテキストなしでHTMLタグのテキストを取得する

分類Dev

テキストの行数を取得する

分類Dev

スクレイピーとxpath:親要素にテキストが含まれている場合、子要素のテキストを取得します

分類Dev

値が空白の場合に表示するテキストを取得するruby4 undefined method `first_name '

分類Dev

Element混合の子をテキストとして取得する方法(JDOM)

分類Dev

jqueryを使用して子テキストを取得する方法

分類Dev

BS4すべてのDIVタグ内からテキストを取得しますが、子は取得しません

分類Dev

子要素なしでdivからテキストを取得する

分類Dev

子divからテキストを取得する

分類Dev

jQueryはtrの子テキストを取得します

分類Dev

bs4を使用してpタグのテキストを取得する方法

分類Dev

子のdivがクリックされたときに、親のdivのテキストを取得する必要があります

分類Dev

同じ行で別々のテキストを取得するBS4

分類Dev

.text()を使用して、子タグにネストされていないテキストのみを取得する

分類Dev

Xpath一部のタグを除く子からテキストコンテンツを取得する方法

分類Dev

テキスト付きの要素が多い場合に要素のテキストを取得する

分類Dev

CSSの最初の子を使用するが、テキストコンテンツを除外する方法

分類Dev

分度器でexpect()を使用するのに問題があり、最初の子のテキストを取得して文字列と比較したい

分類Dev

テキストが子要素の任意のテキストと一致する場合、この子にクラスを追加しますか?

分類Dev

選択イベントで剣道メニューの親と子のテキストを取得する方法

分類Dev

テキスト本文のメールキットを取得する

Related 関連記事

  1. 1

    子供のテキストを取得する jQuery コード

  2. 2

    子要素のテキストを取得する方法

  3. 3

    子が含まれているdivからテキストを取得する方法

  4. 4

    Node.getTextContent()は、子孫のテキストではなく、現在のノードのテキストコンテンツを取得する方法があります

  5. 5

    <br/> python / bs4の前にテキストを取得する

  6. 6

    if / elseステートメントを実行して迷子になる

  7. 7

    子要素のテキストを含めずに、Selenium WebDriverで要素のテキストを取得する方法は?

  8. 8

    親要素のテキストを取得し、子要素のテキストを削除する方法selenium c#?

  9. 9

    内部の子タグのテキストなしでHTMLタグのテキストを取得する

  10. 10

    テキストの行数を取得する

  11. 11

    スクレイピーとxpath:親要素にテキストが含まれている場合、子要素のテキストを取得します

  12. 12

    値が空白の場合に表示するテキストを取得するruby4 undefined method `first_name '

  13. 13

    Element混合の子をテキストとして取得する方法(JDOM)

  14. 14

    jqueryを使用して子テキストを取得する方法

  15. 15

    BS4すべてのDIVタグ内からテキストを取得しますが、子は取得しません

  16. 16

    子要素なしでdivからテキストを取得する

  17. 17

    子divからテキストを取得する

  18. 18

    jQueryはtrの子テキストを取得します

  19. 19

    bs4を使用してpタグのテキストを取得する方法

  20. 20

    子のdivがクリックされたときに、親のdivのテキストを取得する必要があります

  21. 21

    同じ行で別々のテキストを取得するBS4

  22. 22

    .text()を使用して、子タグにネストされていないテキストのみを取得する

  23. 23

    Xpath一部のタグを除く子からテキストコンテンツを取得する方法

  24. 24

    テキスト付きの要素が多い場合に要素のテキストを取得する

  25. 25

    CSSの最初の子を使用するが、テキストコンテンツを除外する方法

  26. 26

    分度器でexpect()を使用するのに問題があり、最初の子のテキストを取得して文字列と比較したい

  27. 27

    テキストが子要素の任意のテキストと一致する場合、この子にクラスを追加しますか?

  28. 28

    選択イベントで剣道メニューの親と子のテキストを取得する方法

  29. 29

    テキスト本文のメールキットを取得する

ホットタグ

アーカイブ