我正在尝试使用Python 3.5和Pandas将以下URL的Excel文件加载到数据框中:
link = "https://hub.coursera-notebooks.org/user/ejquqxfjajkufidbixxvkx/notebooks/Energy%20Indicators.xls"
首先,我尝试使用urllib.request手动下载文件,以便在之后读取它:
import urllib.request
urllib.request.urlretrieve (link, "Energy Indicators.xls")
我得到了文件“ Energy Indicators.xls”,是的,但是它不是有效的xls文件。似乎更像是一个html文件,其扩展名更改为xls。
然后,我尝试使用read_csv直接加载文件:
energy = pd.read_csv(link, skiprows = 16, header = 0, skipfooter = 38)
但是我得到了一个回溯错误:“ pandas.io.common.CParserError:对数据进行令牌化时出错。C错误:第12行中应该有1个字段,看到了2个”。如果我尝试在不带参数跳过行,标题等的情况下读取它,则会收到另一个错误:“ ValueError:第41行中应有1个字段,看到了3个”。
任何想法?顺便说一句,我正在使用Mac OS Sierra和PyCharm Community Edition 2016.3
对于此特定的Coursera练习(不是一般情况),您不能在read_excel函数中使用整个URL,而只能使用“ Energy Indicators.xls”
energy = pd.read_excel('Energy Indicators.xls',...)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句