Python Pandas:基于一列删除重复的行,并连接多列中的信息

安娜

我有一个熊猫数据框,其中包含根据一列(ID)重复的数据,但在其他几列中具有不同的值。我的目标是根据ID删除重复项,但将其他列中的信息连接起来。

这是我正在使用的示例:

ID    Age   Gender   Form          Signature   Level
000   30    M        Paper         Yes         A
000   30    M        Electronic    No          B
001   42             Paper         No          B

处理后,我希望数据看起来像这样:

ID    Age   Gender   Form                      Signature   Level
000   30    M        Paper, Electronic         Yes, No     A, B
001   42             Paper                     No          B

首先,我用“ Not Noted”填充nAn单元格,以便可以使用groupby函数。我尝试了以下代码:

df = df.groupby(['ID', 'Age', 'Gender'])['Form'].apply(set).reset_index()

这需要连接“表单”列,但是我无法弄清楚如何合并“签名”和“级别”列。有没有人有什么建议?

大卫·M

您可以这样做:

import pandas as pd

df = pd.DataFrame({'ID': ['000', '000', '001'],
                   'Age': [30, 30, 42],
                   'Gender': ['M', 'M', ''],
                   'Form': ['Paper', 'Electronic', 'Paper'],
                   'Signature': ['Yes', 'No', 'No'],
                   'Level': ['A', 'B', 'B']})

df = df.groupby(['ID', 'Age', 'Gender']).agg({'Form': set, 'Signature': set, 'Level': set}).reset_index()

print(df)

输出:

    ID  Age Gender                 Form  Signature   Level
0  000  30   M      {Electronic, Paper}  {No, Yes}  {B, A}
1  001  42          {Paper}              {No}       {B} 

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python / Pandas:在数据框中删除重复的行,将值连接在一列中

来自分类Dev

在 Pandas Python 中查找最后一行按一列分组的一列的重复项

来自分类Dev

Python Pandas:从多级列索引中删除一列?

来自分类Dev

如何基于python(pandas,jupyter)中的另一列值获取一列的平均值

来自分类Dev

从Python中的一列替换和删除重复的字符串元素

来自分类Dev

在Python中从一列创建多列

来自分类Dev

记录基于另一列的一列的值:Python和Pandas

来自分类Dev

Python Pandas:检查一列中的值是否存在于另一列中的行子集中

来自分类Dev

遍历一列并删除字符-Python Pandas

来自分类Dev

删除依赖于一列Python的行

来自分类Dev

如何使用 Python 从 Pandas 数据框中删除一列?

来自分类Dev

Python Pandas DataFrame-如何基于另一列(日期类型)中的部分匹配来对一列中的值求和?

来自分类Dev

如果某一列与值匹配,则从数据框中删除行-Python 3.6

来自分类Dev

在Python中删除一列的相似文本行

来自分类Dev

使用Python中的正则表达式从基于2列的csv文件中删除重复的行

来自分类Dev

python / pandas:基于同一列的一系列求和之和更新一列

来自分类Dev

Python在pandas df中匹配多列,然后删除不匹配的行

来自分类Dev

Python Pandas:如何根据给定条件基于另一列创建列?

来自分类Dev

Python 3.4 - Pandas - 基于包含重复项的另一个数据帧的列提取行

来自分类Dev

Python Pandas DataFrame检查一列的值是否在另一列表中

来自分类Dev

如何用一行代码删除python中的多列?

来自分类Dev

一列需要在Pandas Python中拆分的数据

来自分类Dev

Python:在Pandas数据框中添加一列

来自分类Dev

如何使用Python Pandas根据行将一列数据更改为多列?

来自分类Dev

将一列值填充到从Python的多列中随机选择的另一列值

来自分类常见问题

Python Pandas用第二列对应行中的值替换第一列中的NaN

来自分类Dev

在创建基于前一行的值和Python Pandas的另一列的下一行的值时,如何应用屏蔽?

来自分类Dev

对一列进行分组,然后从另一列中查找重复项,然后在Python中返回指示

来自分类Dev

Python:基于另一列长度的条件列

Related 相关文章

  1. 1

    Python / Pandas:在数据框中删除重复的行,将值连接在一列中

  2. 2

    在 Pandas Python 中查找最后一行按一列分组的一列的重复项

  3. 3

    Python Pandas:从多级列索引中删除一列?

  4. 4

    如何基于python(pandas,jupyter)中的另一列值获取一列的平均值

  5. 5

    从Python中的一列替换和删除重复的字符串元素

  6. 6

    在Python中从一列创建多列

  7. 7

    记录基于另一列的一列的值:Python和Pandas

  8. 8

    Python Pandas:检查一列中的值是否存在于另一列中的行子集中

  9. 9

    遍历一列并删除字符-Python Pandas

  10. 10

    删除依赖于一列Python的行

  11. 11

    如何使用 Python 从 Pandas 数据框中删除一列?

  12. 12

    Python Pandas DataFrame-如何基于另一列(日期类型)中的部分匹配来对一列中的值求和?

  13. 13

    如果某一列与值匹配,则从数据框中删除行-Python 3.6

  14. 14

    在Python中删除一列的相似文本行

  15. 15

    使用Python中的正则表达式从基于2列的csv文件中删除重复的行

  16. 16

    python / pandas:基于同一列的一系列求和之和更新一列

  17. 17

    Python在pandas df中匹配多列,然后删除不匹配的行

  18. 18

    Python Pandas:如何根据给定条件基于另一列创建列?

  19. 19

    Python 3.4 - Pandas - 基于包含重复项的另一个数据帧的列提取行

  20. 20

    Python Pandas DataFrame检查一列的值是否在另一列表中

  21. 21

    如何用一行代码删除python中的多列?

  22. 22

    一列需要在Pandas Python中拆分的数据

  23. 23

    Python:在Pandas数据框中添加一列

  24. 24

    如何使用Python Pandas根据行将一列数据更改为多列?

  25. 25

    将一列值填充到从Python的多列中随机选择的另一列值

  26. 26

    Python Pandas用第二列对应行中的值替换第一列中的NaN

  27. 27

    在创建基于前一行的值和Python Pandas的另一列的下一行的值时,如何应用屏蔽?

  28. 28

    对一列进行分组,然后从另一列中查找重复项,然后在Python中返回指示

  29. 29

    Python:基于另一列长度的条件列

热门标签

归档