在 Pandas 中读取带逗号的 CSV 文件时出现问题

阿维纳什·克林顿

在 Pandas 中使用逗号和字符读取 CSV 文件的问题的扩展

当且仅当一列包含逗号作为其字符且其余列表现良好时,上述链接中提供的解决方案才有效。

如果有不止一列有上述问题怎么办?

带有附加逗号问题的 CSV 内容示例:

Name,Age,Address,Phone,Qualification
Suresh,28,Texas,3334567892,B.Tech
Ramesh,24,NewYork, NY,8978974040,9991111234,Ph.D
Mukesh,26,Dallas,4547892345,Ph.D

所需的输出 Pandas 数据帧:

Name    Age  Address      Phone                  Qualification
Suresh  28   Texas        3334567892             B.Tech
Ramesh  24   NewYork, NY  8978974040,9991111234  Ph.D
Mukesh  26   Dallas       4547892345             Ph.D

编辑:

在连续列中以逗号作为字符的输入文件:

Name,Age,Address,Qualification,Grade                  
Suresh,28,Texas,B.Tech,Ph.D,A
Ramesh,24,NewYork, NY,B.Tech,A+
Mukesh,26,Dallas,B.Tech,Ph.D,A

所需的输出 Pandas 数据帧:

Name    Age  Address      Qualification Grade                  
Suresh  28   Texas        B.Tech,Ph.D   A
Ramesh  24   NewYork, NY  B.Tech        A+
Mukesh  26   Dallas       B.Tech,Ph.D   A

我能得到解决这个问题的任何建议吗?

提前致谢!!!

马丁·埃文斯

您的前两列和最后一列的数据看起来都是固定的,因此可以删除这些数据,并且可以使用itertools.groupby()将剩余的列分组为数字或非数字组来处理剩余值然后可以将结果数据加载到熊猫中:

import pandas as pd
from itertools import groupby
import csv

data = []

with open('input.csv', newline='') as f_input:
    csv_input = csv.reader(f_input)
    header = next(csv_input)

    for row in csv_input:
        addr_phone = [','.join(g) for k, g in groupby(row[2:-1], lambda x: x.isdigit())]
        data.append(row[:2] + addr_phone + [row[-1]])

df = pd.DataFrame(data, columns=header)        
print(df)

给你:

     Name Age      Address                  Phone Qualification
0  Suresh  28        Texas             3334567892        B.Tech
1  Ramesh  24  NewYork, NY  8978974040,9991111234          Ph.D
2  Mukesh  26       Dallas             4547892345          Ph.D

要使用第二个示例,您必须决定拆分两列的方法。我建议您创建一个可能的资格列表。当有比赛时,你可以在那个时候分裂。例如:

import pandas as pd
import csv

def find_split(data):
    for index, v in enumerate(data):
        if v.lower() in ['b.tech', 'ph.d']:
            return [', '.join(data[:index]), ', '.join(data[index:])]
    return [', '.join(data), '']

data = []

with open('input.csv', newline='') as f_input:
    csv_input = csv.reader(f_input, skipinitialspace=True)
    header = next(csv_input)

    for row in csv_input:
        data.append(row[:2] + find_split(row[2:-1]) + [row[-1]])

df = pd.DataFrame(data, columns=header)        
print(df)

给你:

     Name Age      Address Qualification Grade
0  Suresh  28        Texas  B.Tech, Ph.D     A
1  Ramesh  24  NewYork, NY        B.Tech    A+
2  Mukesh  26       Dallas  B.Tech, Ph.D     A

您可以首先set()根据row[2](小写)的内容创建一个资格列表打印集合的内容,然后将其添加到脚本中并重新运行它。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

读取csv文件时出现问题

来自分类Dev

从CSV文件读取到Postgresql时出现问题

来自分类Dev

在八度中读取CSV时出现问题

来自分类Dev

导入包含columnigig NULL值或逗号的CSV文件时出现问题

来自分类Dev

使用Text :: CSV在perl中解析CSV文件时出现问题

来自分类Dev

如何在 Python/Pandas 中读取 .csv 文件,其中逗号 (,) 是分隔符并出现在列名中?

来自分类Dev

由于字符串中的逗号,使用PHP导入CSV时出现问题

来自分类Dev

从.cpp文件读取时出现问题

来自分类Dev

读取.txt文件时出现问题

来自分类Dev

从CSV读取数据时出现问题-排序和格式化问题

来自分类常见问题

在Julia中加载CSV文件时出现问题

来自分类Dev

在Julia中加载CSV文件时出现问题

来自分类Dev

将CSV文件转换为XLS时出现问题

来自分类Dev

当我想导入CSV文件时出现问题

来自分类Dev

在R中读取JSON文件时出现问题

来自分类Dev

在Ruby中读取大型JSON文件时出现问题

来自分类Dev

从文件中读取日语字符时出现问题-C

来自分类Dev

在C#中读取Gzip文件时出现问题

来自分类Dev

在R中读取.rdb文件时出现问题

来自分类Dev

在Ruby中读取大型JSON文件时出现问题

来自分类Dev

从WAR文件读取文件时出现问题

来自分类Dev

使用pandas读取csv文件中的目录

来自分类Dev

在 Debian OS 上使用 Pandas 从 github 存储库读取 csv 文件时出现奇怪的 csv 输出

来自分类Dev

从内存读取抓取的csv文件时出现解码问题

来自分类Dev

在将数据帧写入/读取到CSV时出现问题-最终形状-Python

来自分类Dev

Cloud Data Fusion在使用HTTP源读取CSV导出时出现问题

来自分类Dev

使用Pandas在python中读取csv文件时出错

来自分类Dev

读取C txt文件时出现问题

来自分类Dev

使用awk读取系统文件时出现问题

Related 相关文章

  1. 1

    读取csv文件时出现问题

  2. 2

    从CSV文件读取到Postgresql时出现问题

  3. 3

    在八度中读取CSV时出现问题

  4. 4

    导入包含columnigig NULL值或逗号的CSV文件时出现问题

  5. 5

    使用Text :: CSV在perl中解析CSV文件时出现问题

  6. 6

    如何在 Python/Pandas 中读取 .csv 文件,其中逗号 (,) 是分隔符并出现在列名中?

  7. 7

    由于字符串中的逗号,使用PHP导入CSV时出现问题

  8. 8

    从.cpp文件读取时出现问题

  9. 9

    读取.txt文件时出现问题

  10. 10

    从CSV读取数据时出现问题-排序和格式化问题

  11. 11

    在Julia中加载CSV文件时出现问题

  12. 12

    在Julia中加载CSV文件时出现问题

  13. 13

    将CSV文件转换为XLS时出现问题

  14. 14

    当我想导入CSV文件时出现问题

  15. 15

    在R中读取JSON文件时出现问题

  16. 16

    在Ruby中读取大型JSON文件时出现问题

  17. 17

    从文件中读取日语字符时出现问题-C

  18. 18

    在C#中读取Gzip文件时出现问题

  19. 19

    在R中读取.rdb文件时出现问题

  20. 20

    在Ruby中读取大型JSON文件时出现问题

  21. 21

    从WAR文件读取文件时出现问题

  22. 22

    使用pandas读取csv文件中的目录

  23. 23

    在 Debian OS 上使用 Pandas 从 github 存储库读取 csv 文件时出现奇怪的 csv 输出

  24. 24

    从内存读取抓取的csv文件时出现解码问题

  25. 25

    在将数据帧写入/读取到CSV时出现问题-最终形状-Python

  26. 26

    Cloud Data Fusion在使用HTTP源读取CSV导出时出现问题

  27. 27

    使用Pandas在python中读取csv文件时出错

  28. 28

    读取C txt文件时出现问题

  29. 29

    使用awk读取系统文件时出现问题

热门标签

归档