Scrapy: 正しいセレクターを取得する方法

GRS

次のテキストを選択したいと思います。

太字通常斜体

選択して取得する必要があります: 太字の通常のイタリスト。

html は次のとおりです。

<a href=""><strong>Bold</strong> normal <i>Italist</i></a>

ただし、a/text()収量

正常

のみ。誰かが修正を知っていますか?ビング クロールをテストしていますが、クエリによって太字のテキストの位置が異なります。

フランク・マーティン

a//text()代わりに使用a/text()して、すべてのテキスト アイテムを取得できます。

# -*- coding: utf-8 -*-
from scrapy.selector import Selector

doc = """
<a href=""><strong>Bold</strong> normal <i>Italist</i></a>
"""

sel = Selector(text=doc, type="html")

result = sel.xpath('//a/text()').extract()
print result
# >>> [u' normal ']

result = u''.join(sel.xpath('//a//text()').extract())
print result
# >>> Bold normal Italist

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

ScrapyでCSSセレクターを使用してhrefを取得する

分類Dev

Scrapyはデータを抽出していません、cssセレクターは正しいです

分類Dev

Scrapyでクリックしてデータを取得する方法

分類Dev

Xpath。セレクターでタグ名を取得するにはどうすればよいですか。Scrapy

分類Dev

正しいsession_idを取得する方法は?(Scrapy、Python)

分類Dev

Scrapyを使用してCSSセレクターからデータを取得するにはどうすればよいですか?

分類Dev

Scrapy CSS セレクター

分類Dev

Scrapyセレクターから生のhtmlを抽出する方法は?

分類Dev

xpath、scrapyを使用して「THIS」セレクター内でループする

分類Dev

Scrapyはセレクターでcss疑似要素を使用します

分類Dev

Scrapy :: CSSセレクターで「not」を使用して要素をスキップする方法

分類Dev

ScrapyでCSSおよびXpathセレクターを使用する

分類Dev

Scrapy CSS セレクターはタグを無視してテキストのみを取得します

分類Dev

Scrapyを使用してJSONデータをスクレイプする方法

分類Dev

Scrapy:Lowes Webサイトの正しいセレクターを見つける(スクリーンショットを含む)

分類Dev

Scrapy CSSセレクター:すべての内部タグのテキストを取得する

分類Dev

Scrapy CSSセレクター:すべての内部タグのテキストを取得する

分類Dev

データを取得していないリンクをたどるScrapy

分類Dev

Scrapy、CSSセレクターを使用してタグ間のミスサインデータを処理するにはどうすればよいですか?

分類Dev

Scrapyセレクターを使用して一貫性のないマークアップを処理するにはどうすればよいですか?

分類Dev

Cssセレクターまたはxpathを使用してscrapyでデータを抽出する

分類Dev

Scrapy re()セレクターを使用するにはどうすればよいですか?

分類Dev

Scrapyで各クローラーの深さを取得する方法

分類Dev

Scrapyで新しいリンクをスクレイプする方法

分類Dev

Scrapyを使用してdivセレクターからテキストを抽出する

分類Dev

Scrapyを使用して曲をスクレイプする方法

分類Dev

ScrapyフレームワークでRobotsTxtMiddlewareを操作する方法は?

分類Dev

Scrapyを使用して階層データをスクレイピングする

分類Dev

Scrapy投稿データ

Related 関連記事

  1. 1

    ScrapyでCSSセレクターを使用してhrefを取得する

  2. 2

    Scrapyはデータを抽出していません、cssセレクターは正しいです

  3. 3

    Scrapyでクリックしてデータを取得する方法

  4. 4

    Xpath。セレクターでタグ名を取得するにはどうすればよいですか。Scrapy

  5. 5

    正しいsession_idを取得する方法は?(Scrapy、Python)

  6. 6

    Scrapyを使用してCSSセレクターからデータを取得するにはどうすればよいですか?

  7. 7

    Scrapy CSS セレクター

  8. 8

    Scrapyセレクターから生のhtmlを抽出する方法は?

  9. 9

    xpath、scrapyを使用して「THIS」セレクター内でループする

  10. 10

    Scrapyはセレクターでcss疑似要素を使用します

  11. 11

    Scrapy :: CSSセレクターで「not」を使用して要素をスキップする方法

  12. 12

    ScrapyでCSSおよびXpathセレクターを使用する

  13. 13

    Scrapy CSS セレクターはタグを無視してテキストのみを取得します

  14. 14

    Scrapyを使用してJSONデータをスクレイプする方法

  15. 15

    Scrapy:Lowes Webサイトの正しいセレクターを見つける(スクリーンショットを含む)

  16. 16

    Scrapy CSSセレクター:すべての内部タグのテキストを取得する

  17. 17

    Scrapy CSSセレクター:すべての内部タグのテキストを取得する

  18. 18

    データを取得していないリンクをたどるScrapy

  19. 19

    Scrapy、CSSセレクターを使用してタグ間のミスサインデータを処理するにはどうすればよいですか?

  20. 20

    Scrapyセレクターを使用して一貫性のないマークアップを処理するにはどうすればよいですか?

  21. 21

    Cssセレクターまたはxpathを使用してscrapyでデータを抽出する

  22. 22

    Scrapy re()セレクターを使用するにはどうすればよいですか?

  23. 23

    Scrapyで各クローラーの深さを取得する方法

  24. 24

    Scrapyで新しいリンクをスクレイプする方法

  25. 25

    Scrapyを使用してdivセレクターからテキストを抽出する

  26. 26

    Scrapyを使用して曲をスクレイプする方法

  27. 27

    ScrapyフレームワークでRobotsTxtMiddlewareを操作する方法は?

  28. 28

    Scrapyを使用して階層データをスクレイピングする

  29. 29

    Scrapy投稿データ

ホットタグ

アーカイブ