使用Scrapy无法获取任何数据

费达里科·瓜斯塔迪斯格尼

我正在尝试抓取以下网站:

http://search.scielo.org/?q=science&lang=pt&count=50&from=0&output=site&sort=&format=summary&fb=&page=1

使用此代码:

def parse_web11(self, response): 

    for publication in response.css('div.content > div.searchForm > div.container resultBlock > div.col-md-9 col-sm-8 > div.results > div.item'):

        author = publication.xpath('./div[@class="col-md-11 col-sm-10 col-xs-11"]/div[@class="line authors"]/a/text()').extract_first()
        title = publication.xpath('./div[@class="col-md-11 col-sm-10 col-xs-11"]/div[@class="line"]/a/strong[@class="title"]/text()').extract_first()
        doi = publication.css("strong[@class='DOIResults']::text()").extract_first()
        link = publication.xpath('./div[@class="col-md-11 col-sm-10 col-xs-11"]/div[@class="line"]/a/@href').extract_first()
        year = publication.xpath('./div[@class="col-md-11 col-sm-10 col-xs-11"]/div[@class="line source"]/span/text()').re_first(r'\d\d\d\d')


        print(author,title,doi,link,year)
        raw_input()

但我没有结果。

ec

publication选择器简化为

div.results > div.item

从外壳演示:

$ scrapy shell "http://search.scielo.org/?q=science&lang=pt&count=50&from=0&output=site&sort=&format=summary&fb=&page=1"
>>> for publication in response.css('div.results > div.item'):
...     print(publication.xpath('.//a/strong[@class="title"]/text()').extract_first())

Ensaio sobre os nós das redes logísticas
Segurança de pedestres em rotatórias urbanas
...
Comparação do processo de categorização de documentos utilizando palavras-chave e citações em um domínio de conhecimento restrito
A ciência nas regiões brasileiras: evolução da produção e das redes de colaboração científica

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

无法从API获取任何数据

来自分类Dev

无法从任何形式获取任何$ _POST数据

来自分类Dev

任何使用scrapy获取JS对象的方法

来自分类Dev

无法使用Scrapy提取数据

来自分类Dev

无法使用Scrapy提取数据

来自分类Dev

Python-Scrapy无法获取数据

来自分类Dev

跟随链接时Scrapy无法获取数据

来自分类Dev

Scrapy无法获取所有数据

来自分类Dev

Scrapy Splash 无法获取 React 站点的数据

来自分类Dev

如何使用scrapy xpath获取数据

来自分类Dev

使用scrapy获取脚本中的数据

来自分类Dev

无法使用 scrapy 抓取 snapdeal 数据

来自分类Dev

sqlalchemy:无法从数据库获取任何数据

来自分类Dev

无法使用GORM获取数据

来自分类Dev

无法使用NSXmlParser获取数据

来自分类Dev

无法使用 alamofire 获取数据

来自分类Dev

[Swift]我无法从特定网址获取任何JSON数据

来自分类Dev

Angular2无法获取任何响应数据

来自分类Dev

无法使用获取Api获取数据

来自分类Dev

使用Instagram API和我自己的访问令牌,为什么我无法获取任何用户的数据?

来自分类Dev

无法使用scrapy获取HTML表中的行数

来自分类Dev

使用 Scrapy 无法从父 div 获取子 xpath

来自分类Dev

使用scrapy搜寻动态网页以获取数据

来自分类Dev

使用Scrapy从HTML中的<script>标记获取数据

来自分类Dev

使用scrapy获取“下一页”数据

来自分类Dev

如何使用scrapy从CSS选择器获取数据?

来自分类Dev

无法使用 Scrapy 从网页加载和抓取数据

来自分类Dev

使用SQL获取唯一ID但不丢失任何数据

来自分类Dev

无法使用json jquery获取数据