使用熊猫从URL文件下载/加载xls

安东尼奥·塞拉诺(Antonio Serrano)

我正在尝试使用Python 3.5和Pandas将以下URL的Excel文件加载到数据框中:

link = "https://hub.coursera-notebooks.org/user/ejquqxfjajkufidbixxvkx/notebooks/Energy%20Indicators.xls"

首先,我尝试使用urllib.request手动下载文件,以便在之后读取它:

import urllib.request
urllib.request.urlretrieve (link, "Energy Indicators.xls")

我得到了文件“ Energy Indicators.xls”,是的,但是它不是有效的xls文件。似乎更像是一个html文件,其扩展名更改为xls。

然后,我尝试使用read_csv直接加载文件:

energy = pd.read_csv(link, skiprows = 16, header = 0, skipfooter = 38)

但是我得到了一个回溯错误:“ pandas.io.common.CParserError:对数据进行令牌化时出错。C错误:第12行中应该有1个字段,看到了2个”。如果我尝试在不带参数跳过行,标题等的情况下读取它,则会收到另一个错误:“ ValueError:第41行中应有1个字段,看到了3个”。

任何想法?顺便说一句,我正在使用Mac OS Sierra和PyCharm Community Edition 2016.3

爱德华3192993

对于此特定的Coursera练习(不是一般情况),您不能在read_excel函数中使用整个URL,而只能使用“ Energy Indicators.xls”

energy = pd.read_excel('Energy Indicators.xls',...)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用熊猫从URL下载/加载压缩的csv文件

来自分类Dev

通过 url 循环下载 xls 文件给我损坏的文件

来自分类Dev

下载.xls文件

来自分类Dev

使用熊猫读取下载的HTML文件

来自分类Dev

使用R下载* .xls文件会产生错误

来自分类Dev

瓶熊猫返回xls文件

来自分类Dev

尝试使用CSV文件从URL下载数据

来自分类Dev

如何使用Express从url下载文件?

来自分类Dev

使用python下载带有URL的文件

来自分类Dev

仅使用URL下载文件

来自分类Dev

使用循环下载 url/文件列表 - python

来自分类Dev

使用GET参数从URL打开Excel(XLS)文件

来自分类Dev

Ruby / Nokogiri / Mechanize:如何下载XLS文件?

来自分类Dev

在grails中加密xls文件并下载

来自分类Dev

从网页、网络爬虫下载 xls 文件

来自分类Dev

在xls文件上加载上传文件错误

来自分类Dev

在xls文件上加载上传文件错误

来自分类Dev

在python中下载和使用xls文件时出现问题

来自分类Dev

使用 Angular 和 Spring Boot 下载 Excel 会产生损坏的 xls 文件

来自分类Dev

将xlsx文件转换为xls以与熊猫一起使用

来自分类Dev

从URL下载文件

来自分类Dev

文件不是从url下载的

来自分类Dev

从URL下载Zip文件

来自分类Dev

熊猫加载csv文件ValueError

来自分类Dev

使用axlsx生成xls文件

来自分类Dev

使用php导出xls文件

来自分类Dev

使用外部资源的URL在Laravel中下载文件

来自分类Dev

使用PHP从API下载CSV文件-URL不以.csv结尾

来自分类Dev

如何使用C#从URL下载ZIP文件?