SCRAPYでのXPATHセレクターの形成

debugcn 投稿 Dev

リラップ

ページから製品名を取得しようとしています：

https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html

有用で特定の結果を返すXPATHが見つかりません。

私の最初の投稿がそのような初心者の質問であることをお詫びします:(

class V12Spider(scrapy.Spider):
name = 'v12'
start_urls = ['https://www.v12outdoor.com/view-by-category/rock-climbing-gear/rock-climbing-shoes/mens.html']


def parse(self, response):
    yield {
        'price' : response.xpath('//span[@id="product-price-26901"]/text()'),
        'name' : response.xpath('//h3[@class="product-name"]/a/text()'),
           }

の場合name、h3クラスクラスのタグ内のアイテムから名前を生成することを期待していましたproduct-nameが、複数行のデータを生成します= '\ r \ n

（私たちがそれに取り組んでいる間price、数値だけを引き出す方法はありますか？）

glory9211

直面している問題は、xpathにget（）メソッドを使用してから、stringにstrip（）メソッドを使用することで解決できます。私はこのようなことを試みました

name= response.xpath('//h3[@class="product-name"]/a/text()').get()

与える

'\r\n                                RED CHILLI VOLTAGE                            '

次に使用する

name.strip()

与える

'RED CHILLI VOLTAGE'

したがって、名前ステートメントを次のように置き換えることができます

name= response.xpath('//h3[@class="product-name"]/a/text()').get().strip()

価格を取得するための同じソリューションは、ステートメントの最後に.get（）。stripを追加するだけです

うまくいけば、これが役立つでしょう。https://docs.scrapy.org/en/latest/topics/selectors.htmlから.getall（）メソッドについてもお読みください

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2021-06-11

コメントを追加

サインイン

分類Dev

Scrapy Xpath セレクターが一部の式で機能しない

分類Dev

ScrapyのXpathとCSSセレクター：データの保存方法が異なるのはなぜですか？

分類Dev

Scrapy Webクローラーのcss＆xpathセレクターとBeautifulSoup

分類Dev

ScrapyでCSSおよびXpathセレクターを使用する

分類Dev

xpathセレクターと同等のCSSセレクター

分類Dev

xpath、scrapyを使用して「THIS」セレクター内でループする

分類Dev

HTMLタグの外側のScrapyセレクター

分類Dev

セレクターはPythonのScrapyで何も返しません

分類Dev

Xpathまたはcssセレクター-scrapy

分類Dev

Scrapyループ-適用されるオブジェクトをエスケープしてすべてのレコードを返すxpathセレクター？

分類Dev

find_element_by_xpathでセレクターの値を確認します

分類Dev

Scrapy-CSSセレクターの問題

分類Dev

Scrapy CSS セレクター

分類Dev

Xpath。セレクターでタグ名を取得するにはどうすればよいですか。Scrapy

分類Dev

XPATH式の同等のCSSセレクターが必要

分類Dev

PuppeteerのCSSセレクターの代わりにXPath式？

分類Dev

Cssセレクターまたはxpathを使用してscrapyでデータを抽出する

分類Dev

xpath / cssサブクラスのセレクター

分類Dev

上記の要素に基づくXPathセレクター

分類Dev

連続する要素のCSSまたはXPathセレクター

分類Dev

「すべて」の相対XPathセレクター

分類Dev

Cssセレクター/ xpath

分類Dev

祖先が特定のノードではないノードのXPathセレクター

分類Dev

Puppeteerのpage.typeでCSSセレクターの代わりにXPath式を使用できますか？

分類Dev

HTMLページのリストのxpathセレクターを取得できません

分類Dev

Ext 3で同等の$（セレクター）

分類Dev

セレクターでの連結

分類Dev