次のテキストを選択したいと思います。
太字通常斜体
選択して取得する必要があります: 太字の通常のイタリスト。
html は次のとおりです。
<a href=""><strong>Bold</strong> normal <i>Italist</i></a>
ただし、a/text()
収量
正常
のみ。誰かが修正を知っていますか?ビング クロールをテストしていますが、クエリによって太字のテキストの位置が異なります。
a//text()
代わりに使用a/text()
して、すべてのテキスト アイテムを取得できます。
# -*- coding: utf-8 -*-
from scrapy.selector import Selector
doc = """
<a href=""><strong>Bold</strong> normal <i>Italist</i></a>
"""
sel = Selector(text=doc, type="html")
result = sel.xpath('//a/text()').extract()
print result
# >>> [u' normal ']
result = u''.join(sel.xpath('//a//text()').extract())
print result
# >>> Bold normal Italist
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加