使用熊猫从URL下载/加载压缩的csv文件

安东尼奥·塞拉诺(Antonio Serrano)

我正在尝试使用Python 3.5和Pandas将以下URL的csv文件加载到数据帧中:

link = "http://api.worldbank.org/v2/en/indicator/NY.GDP.MKTP.CD?downloadformat=csv"

CSV文件(API_NY.GDP.MKTP.CD_DS2_zh_csv_v2.csv)位于zip文件中。我的尝试:

import urllib.request
urllib.request.urlretrieve(link, "GDP.zip")
import zipfile
compressed_file = zipfile.ZipFile('GDP.zip')
csv_file = compressed_file.open('API_NY.GDP.MKTP.CD_DS2_en_csv_v2.csv')
GDP = pd.read_csv(csv_file)

但是在阅读它时,出现错误“ pandas.io.common.CParserError:对数据进行令牌化时出错。C错误:第5行中应有3个字段,看到了62个”。

任何想法?

耶斯列尔

我认为您需要参数skiprows,因为csv标头在row中5

GDP = pd.read_csv(csv_file, skiprows=4)
print (GDP.head())
  Country Name Country Code     Indicator Name  Indicator Code          1960  \
0        Aruba          ABW  GDP (current US$)  NY.GDP.MKTP.CD           NaN   
1      Andorra          AND  GDP (current US$)  NY.GDP.MKTP.CD           NaN   
2  Afghanistan          AFG  GDP (current US$)  NY.GDP.MKTP.CD  5.377778e+08   
3       Angola          AGO  GDP (current US$)  NY.GDP.MKTP.CD           NaN   
4      Albania          ALB  GDP (current US$)  NY.GDP.MKTP.CD           NaN   

           1961          1962          1963          1964          1965  \
0           NaN           NaN           NaN           NaN           NaN   
1           NaN           NaN           NaN           NaN           NaN   
2  5.488889e+08  5.466667e+08  7.511112e+08  8.000000e+08  1.006667e+09   
3           NaN           NaN           NaN           NaN           NaN   
4           NaN           NaN           NaN           NaN           NaN   

              2008          2009          2010          2011  \
0     ...       2.791961e+09  2.498933e+09  2.467704e+09  2.584464e+09   
1     ...       4.001201e+09  3.650083e+09  3.346517e+09  3.427023e+09   
2     ...       1.019053e+10  1.248694e+10  1.593680e+10  1.793024e+10   
3     ...       8.417803e+10  7.549238e+10  8.247091e+10  1.041159e+11   
4     ...       1.288135e+10  1.204421e+10  1.192695e+10  1.289087e+10   

           2012          2013          2014          2015  2016  Unnamed: 61  
0           NaN           NaN           NaN           NaN   NaN          NaN  
1  3.146152e+09  3.248925e+09           NaN           NaN   NaN          NaN  
2  2.053654e+10  2.004633e+10  2.005019e+10  1.933129e+10   NaN          NaN  
3  1.153984e+11  1.249121e+11  1.267769e+11  1.026269e+11   NaN          NaN  
4  1.231978e+10  1.278103e+10  1.321986e+10  1.139839e+10   NaN          NaN  

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

使用熊猫从URL文件下载/加载xls

来自分类Dev

使用R下载压缩数据文件,提取并导入.csv

来自分类Dev

使用R下载压缩数据文件,提取并导入.csv

来自分类Dev

使用python从url下载多个压缩文件

来自分类Dev

尝试使用CSV文件从URL下载数据

来自分类Dev

通过https下载大型压缩的csv,解压缩并加载

来自分类Dev

熊猫加载csv文件ValueError

来自分类Dev

使用PHP从API下载CSV文件-URL不以.csv结尾

来自分类Dev

从URL读取压缩的Stata文件到熊猫

来自分类Dev

使用php压缩并下载文件

来自分类Dev

单击 url 下载 gz 文件并使用 scala 转换为 csv

来自分类Dev

使用pandas.read_csv从URL读取压缩的CSV文件时出错

来自分类Dev

用熊猫加载大CSV文件

来自分类Dev

使用python下载.csv文件

来自分类Dev

使用熊猫读取下载的HTML文件

来自分类Dev

使用PHP从Amazon s3压缩并下载文件

来自分类Dev

使用PHP下载后无法解压缩.zip文件

来自分类Dev

使用R下载和读取压缩的xml文件

来自分类Dev

如何使用Java下载和解压缩ZIP文件

来自分类Dev

使用scrapy抓取后如何压缩和清理下载的文件

来自分类Dev

在Shiny的压缩文件夹中下载多个csv文件

来自分类Dev

如何使用bash脚本从具有URL的CSV文件中下载?

来自分类Dev

下载和处理要在Oracle中加载的非常大的MS压缩文件的最佳方法

来自分类Dev

使用curl下载csv中的文件列表

来自分类Dev

使用ruby sinatra从ftp下载CSV文件

来自分类Dev

Java:使用 REST 服务下载 CSV 文件

来自分类Dev

使用python从特定站点下载csv文件

来自分类Dev

使用IDP下载.zip文件:下载用于Inno Setup的插件,并将其解压缩

来自分类Dev

使用numpy.load从文件中加载压缩数据(.npz)

Related 相关文章

热门标签

归档