SCRAPYでのXPATHセレクターの形成

リラップ

ページから製品名を取得しようとしています:

https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html

有用で特定の結果を返すXPATHが見つかりません。

私の最初の投稿がそのような初心者の質問であることをお詫びします:(

class V12Spider(scrapy.Spider):
name = 'v12'
start_urls = ['https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html']


def parse(self, response):
    yield {
        'price' : response.xpath('//span[@id="product-price-26901"]/text()'),
        'name' : response.xpath('//h3[@class="product-name"]/a/text()'),
           }

の場合nameh3クラスクラスのタグ内のアイテムから名前を生成することを期待していましたproduct-nameが、複数行のデータを生成します= '\ r \ n

(私たちがそれに取り組んでいる間price、数値だけを引き出す方法はありますか?)

glory9211

直面している問題は、xpathにget()メソッドを使用してから、stringにstrip()メソッドを使用することで解決できます。私はこのようなことを試みました

name= response.xpath('//h3[@class="product-name"]/a/text()').get()

与える

'\r\n                                RED CHILLI VOLTAGE                            '

次に使用する

name.strip()

与える

'RED CHILLI VOLTAGE'

したがって、名前ステートメントを次のように置き換えることができます

name= response.xpath('//h3[@class="product-name"]/a/text()').get().strip()

価格を取得するための同じソリューションは、ステートメントの最後に.get()。stripを追加するだけです

うまくいけば、これが役立つでしょう。https://docs.scrapy.org/en/latest/topics/selectors.htmlから.getall()メソッドについてもお読みください

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

分類Dev

Scrapy Xpath セレクターが一部の式で機能しない

分類Dev

ScrapyのXpathとCSSセレクター:データの保存方法が異なるのはなぜですか?

分類Dev

Scrapy Webクローラーのcss&xpathセレクターとBeautifulSoup

分類Dev

ScrapyでCSSおよびXpathセレクターを使用する

分類Dev

xpathセレクターと同等のCSSセレクター

分類Dev

xpath、scrapyを使用して「THIS」セレクター内でループする

分類Dev

HTMLタグの外側のScrapyセレクター

分類Dev

セレクターはPythonのScrapyで何も返しません

分類Dev

Xpathまたはcssセレクター-scrapy

分類Dev

Scrapyループ-適用されるオブジェクトをエスケープしてすべてのレコードを返すxpathセレクター?

分類Dev

find_element_by_xpathでセレクターの値を確認します

分類Dev

Scrapy-CSSセレクターの問題

分類Dev

Scrapy CSS セレクター

分類Dev

Xpath。セレクターでタグ名を取得するにはどうすればよいですか。Scrapy

分類Dev

XPATH式の同等のCSSセレクターが必要

分類Dev

PuppeteerのCSSセレクターの代わりにXPath式?

分類Dev

Cssセレクターまたはxpathを使用してscrapyでデータを抽出する

分類Dev

xpath / cssサブクラスのセレクター

分類Dev

上記の要素に基づくXPathセレクター

分類Dev

連続する要素のCSSまたはXPathセレクター

分類Dev

「すべて」の相対XPathセレクター

分類Dev

Cssセレクター/ xpath

分類Dev

祖先が特定のノードではないノードのXPathセレクター

分類Dev

Puppeteerのpage.typeでCSSセレクターの代わりにXPath式を使用できますか?

分類Dev

HTMLページのリストのxpathセレクターを取得できません

分類Dev

Ext 3で同等の$(セレクター)

分類Dev

セレクターでの連結

分類Dev

xpathの同等のcssセレクターは何ですか:// * [@ id = 'sortable-item_2'] / div / div [2] / ul / li [1] / a / strong

分類Dev

Scrapyセレクターから生のhtmlを抽出する方法は?

Related 関連記事

  1. 1

    Scrapy Xpath セレクターが一部の式で機能しない

  2. 2

    ScrapyのXpathとCSSセレクター:データの保存方法が異なるのはなぜですか?

  3. 3

    Scrapy Webクローラーのcss&xpathセレクターとBeautifulSoup

  4. 4

    ScrapyでCSSおよびXpathセレクターを使用する

  5. 5

    xpathセレクターと同等のCSSセレクター

  6. 6

    xpath、scrapyを使用して「THIS」セレクター内でループする

  7. 7

    HTMLタグの外側のScrapyセレクター

  8. 8

    セレクターはPythonのScrapyで何も返しません

  9. 9

    Xpathまたはcssセレクター-scrapy

  10. 10

    Scrapyループ-適用されるオブジェクトをエスケープしてすべてのレコードを返すxpathセレクター?

  11. 11

    find_element_by_xpathでセレクターの値を確認します

  12. 12

    Scrapy-CSSセレクターの問題

  13. 13

    Scrapy CSS セレクター

  14. 14

    Xpath。セレクターでタグ名を取得するにはどうすればよいですか。Scrapy

  15. 15

    XPATH式の同等のCSSセレクターが必要

  16. 16

    PuppeteerのCSSセレクターの代わりにXPath式?

  17. 17

    Cssセレクターまたはxpathを使用してscrapyでデータを抽出する

  18. 18

    xpath / cssサブクラスのセレクター

  19. 19

    上記の要素に基づくXPathセレクター

  20. 20

    連続する要素のCSSまたはXPathセレクター

  21. 21

    「すべて」の相対XPathセレクター

  22. 22

    Cssセレクター/ xpath

  23. 23

    祖先が特定のノードではないノードのXPathセレクター

  24. 24

    Puppeteerのpage.typeでCSSセレクターの代わりにXPath式を使用できますか?

  25. 25

    HTMLページのリストのxpathセレクターを取得できません

  26. 26

    Ext 3で同等の$(セレクター)

  27. 27

    セレクターでの連結

  28. 28

    xpathの同等のcssセレクターは何ですか:// * [@ id = 'sortable-item_2'] / div / div [2] / ul / li [1] / a / strong

  29. 29

    Scrapyセレクターから生のhtmlを抽出する方法は?

ホットタグ

アーカイブ