使用熊猫从URL文件下载/加载xls

debugcn 发表于 Dev

安东尼奥·塞拉诺（Antonio Serrano）

我正在尝试使用Python 3.5和Pandas将以下URL的Excel文件加载到数据框中：

link = "https://hub.coursera-notebooks.org/user/ejquqxfjajkufidbixxvkx/notebooks/Energy%20Indicators.xls"

首先，我尝试使用urllib.request手动下载文件，以便在之后读取它：

import urllib.request
urllib.request.urlretrieve (link, "Energy Indicators.xls")

我得到了文件“ Energy Indicators.xls”，是的，但是它不是有效的xls文件。似乎更像是一个html文件，其扩展名更改为xls。

然后，我尝试使用read_csv直接加载文件：

energy = pd.read_csv(link, skiprows = 16, header = 0, skipfooter = 38)

但是我得到了一个回溯错误：“ pandas.io.common.CParserError：对数据进行令牌化时出错。C错误：第12行中应该有1个字段，看到了2个”。如果我尝试在不带参数跳过行，标题等的情况下读取它，则会收到另一个错误：“ ValueError：第41行中应有1个字段，看到了3个”。

任何想法？顺便说一句，我正在使用Mac OS Sierra和PyCharm Community Edition 2016.3

爱德华3192993

对于此特定的Coursera练习（不是一般情况），您不能在read_excel函数中使用整个URL，而只能使用“ Energy Indicators.xls”

energy = pd.read_excel('Energy Indicators.xls',...)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

使用熊猫从URL下载/加载压缩的csv文件

来自分类Dev

通过 url 循环下载 xls 文件给我损坏的文件

来自分类Dev

下载.xls文件

来自分类Dev

使用熊猫读取下载的HTML文件

来自分类Dev

使用R下载* .xls文件会产生错误

来自分类Dev

瓶熊猫返回xls文件

来自分类Dev

尝试使用CSV文件从URL下载数据

来自分类Dev

如何使用Express从url下载文件？

来自分类Dev

使用python下载带有URL的文件

来自分类Dev

仅使用URL下载文件

来自分类Dev

使用循环下载 url/文件列表 - python

来自分类Dev

使用GET参数从URL打开Excel（XLS）文件

来自分类Dev

Ruby / Nokogiri / Mechanize：如何下载XLS文件？

来自分类Dev

在grails中加密xls文件并下载

来自分类Dev

从网页、网络爬虫下载 xls 文件

来自分类Dev

在xls文件上加载上传文件错误

来自分类Dev

在xls文件上加载上传文件错误

来自分类Dev

在python中下载和使用xls文件时出现问题

来自分类Dev

使用 Angular 和 Spring Boot 下载 Excel 会产生损坏的 xls 文件

来自分类Dev

将xlsx文件转换为xls以与熊猫一起使用

来自分类Dev

从URL下载文件

来自分类Dev

文件不是从url下载的

来自分类Dev

从URL下载Zip文件

来自分类Dev

熊猫加载csv文件ValueError

来自分类Dev

使用axlsx生成xls文件

来自分类Dev

使用php导出xls文件

来自分类Dev

使用外部资源的URL在Laravel中下载文件

来自分类Dev

使用PHP从API下载CSV文件-URL不以.csv结尾

来自分类Dev

如何使用C＃从URL下载ZIP文件？

Related 相关文章

文章