如何检测在 Pandas 上读取 excel 文件时要跳过的行数

debugcn 发表于 Dev

代码.dev.world

我想使用 python pandas 读取 .xlsx。问题是在 excel 文件的开头，它有一些额外的数据，如表格的标题或描述，表格内容开始。这引入了未命名的列，因为 Pandas DataReader 将它作为列。但是表格内容在几行之后开始。

A                              B                     C
this is description
last updated: Mar 18th,2014
                               Table content
Country                        Year                 Product_output
Canada                         2017                 3002
Bulgaria                       2016                 2201
...

表内容从第 4 行开始。列必须是“国家”、“年份”、“proudct_output”而不是“这是描述”、“未命名”、“未命名”。对于这种特定情况，将skiprows参数设置为 3 解决了问题（来自 Mikhail Venkov）。但是我要处理很多excel文件，我不知道要提前跳过多少行。我认为可能有一个解决方案，因为每个表列标题都有一个过滤器。

安和

如果您知道特定文本（如国家/地区）必须在第一列中，您可以执行以下操作：

import xlrd
xl_work = xlrd.open_workbook("Classeur1.xlsx")
mySheet = xl_work.sheet_by_index(0)

nl = 0
while mySheet.cell_value(nl,0) != "Country" :
    nl += 1

line_with_headers = nl

然后使用跳过nl而不是 3。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-18

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何检测在 Pandas 上读取 excel 文件时要跳过的行数

如何检测在 Pandas 上读取 excel 文件时要跳过的行数

读取 html 上的 excel 文件时换行

Python & Pandas：读取数据时如何跳过创建中间数据文件？

读取Excel时出现Pandas的AssertionError

读取Excel时出现Pandas的AssertionError

在服务器上读取Excel文件

读取CSV文件时如何跳过列？

如何在Java-Web Start应用程序上读取Excel文件

python pandas如何在没有未命名列的情况下读取excel文件

读取Excel档案时出现Pandas和Xlrd错误

将Excel文件读取到Pandas DataFrame的更快方法

读取多索引Excel文件并重塑Pandas中的标题

Pandas.read_excel KeyError 读取 xlsx 文件集

使用pandas从excel文件中读取特定列

如何在 C# 中跳过列标题读取 excel 文件？

如何使用索引而不是pandas.read_excel的名称来读取Excel工作表？

在python中读取Yaml文件时如何跳过行？

逐行读取文件时如何跳过字符串

从文件读取时如何跳过字符串中的空格

从文件读取时如何跳过原始数据值

使用fscanf（）读取时如何跳过文件中的损坏数据

从PHP中的文件指针读取时如何跳过多行

跳过未知行数以读取标头python pandas

如何从excel或ods文件读取分页的行？

如何在Python中读取Excel文件？

Java：Excel/Json - 如何读取 Json 文件并写入 Excel

如何在C ++上读取多个文件

如何使用C ++在Hololens上读取文件

如何在Windows上读取Linux文件？

如何使用python读取ftp上的文件？