搜索

搜索

Scrapy-无法获取表中的值

debugcn 发表于 Dev

14

深呼吸

这是HTML页面

这是我的代码

import scrapy

class get_taiex(scrapy.Spider):
    name='get_taiex'
    def start_requests(self):
        url ='https://www.twse.com.tw/indicesReport/MI_5MINS_HIST?response=html&date=20191101'
        yield scrapy.Request(url, callback=self.parse)

    def parse(self, response):
        for row in response.xpath('//tbody/tr'):
            yield {
                'date' : row.xpath('td[1]/text()').extract_first(),
                'open' : row.xpath('td[2]/text()').extract_first(),
                'high' : row.xpath('td[3]/text()').extract_first(),
                'low' : row.xpath('td[4]/text()').extract_first(),
                'close' : row.xpath('td[5]/text()').extract_first()
            }

我不知道为什么它不起作用

在此页面上工作正常

区别只是div标签

我将其用于json输出

抓取抓取get_taiex -o output.json -t json

谢谢。

莫恩·卡梅利（Moein Kameli）

您可能使用的新版本scrapy会Forbidden by robots.txt因此而空，response因此您需要在您的中进行更改setting.py：

ROBOTSTXT_OBEY = False

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-1

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

无法使用scrapy获取HTML表中的行数

来自分类Dev

Scrapy 从请求 url 中获取错误的值

来自分类Dev

Scrapy：无法找到表或在表中刮取数据

来自分类Dev

在 python scrapy 中获取文本

来自分类Dev

Python如何从基本表中获取Scrapy Xpath数据？

来自分类Dev

获取Scrapy Logger

来自分类Dev

通过Scrapy获取“ ParseError”

来自分类Dev

在scrapy中获取文本的值（没有标签）

来自分类Dev

无法运行 Scrapy 代码

来自分类Dev

Scrapy 无法正常工作

来自分类Dev

Scrapy：无法解决错误

来自分类Dev

Python-Scrapy无法获取数据

来自分类Dev

跟随链接时Scrapy无法获取数据

来自分类Dev

Scrapy无法获取所有数据

来自分类Dev

Scrapy-无法从xpath / css获取输出

来自分类Dev

使用Scrapy无法获取任何数据

来自分类Dev

Scrapy Splash 无法获取 React 站点的数据

来自分类Dev

Scrapy中的内存泄漏

来自分类Dev

XPath for Scrapy中的OR条件

来自分类Dev

在scrapy中启用deltafetch

来自分类Dev

在Scrapy中抓取并连接

来自分类Dev

在Scrapy中结合蜘蛛

来自分类Dev

XPath for Scrapy中的OR条件

来自分类Dev

Scrapy中的编号项目

来自分类Dev

Scrapy 中的限制请求

来自分类Dev

使用Scrapy从表中收集数据

来自分类Dev

使用Scrapy从表中收集数据

来自分类Dev

Scrapy在解析中获取请求URL

来自分类Dev

如何从scrapy的后续函数中获取数据

Related 相关文章

文章

热门标签

归档