搜索

搜索

Python Pandas：基于一列删除重复的行，并连接多列中的信息

debugcn 发表于 Dev

18

安娜

我有一个熊猫数据框，其中包含根据一列（ID）重复的数据，但在其他几列中具有不同的值。我的目标是根据ID删除重复项，但将其他列中的信息连接起来。

这是我正在使用的示例：

ID    Age   Gender   Form          Signature   Level
000   30    M        Paper         Yes         A
000   30    M        Electronic    No          B
001   42             Paper         No          B

处理后，我希望数据看起来像这样：

ID    Age   Gender   Form                      Signature   Level
000   30    M        Paper, Electronic         Yes, No     A, B
001   42             Paper                     No          B

首先，我用“ Not Noted”填充nAn单元格，以便可以使用groupby函数。我尝试了以下代码：

df = df.groupby(['ID', 'Age', 'Gender'])['Form'].apply(set).reset_index()

这需要连接“表单”列，但是我无法弄清楚如何合并“签名”和“级别”列。有没有人有什么建议？

大卫·M

您可以这样做：

import pandas as pd

df = pd.DataFrame({'ID': ['000', '000', '001'],
                   'Age': [30, 30, 42],
                   'Gender': ['M', 'M', ''],
                   'Form': ['Paper', 'Electronic', 'Paper'],
                   'Signature': ['Yes', 'No', 'No'],
                   'Level': ['A', 'B', 'B']})

df = df.groupby(['ID', 'Age', 'Gender']).agg({'Form': set, 'Signature': set, 'Level': set}).reset_index()

print(df)

输出：

    ID  Age Gender                 Form  Signature   Level
0  000  30   M      {Electronic, Paper}  {No, Yes}  {B, A}
1  001  42          {Paper}              {No}       {B}

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-8

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

Python / Pandas：在数据框中删除重复的行，将值连接在一列中

来自分类Dev

在 Pandas Python 中查找最后一行按一列分组的一列的重复项

来自分类Dev

Python Pandas：从多级列索引中删除一列？

来自分类Dev

如何基于python（pandas，jupyter）中的另一列值获取一列的平均值

来自分类Dev

从Python中的一列替换和删除重复的字符串元素

来自分类Dev

在Python中从一列创建多列

来自分类Dev

记录基于另一列的一列的值：Python和Pandas

来自分类Dev

Python Pandas：检查一列中的值是否存在于另一列中的行子集中

来自分类Dev

遍历一列并删除字符-Python Pandas

来自分类Dev

删除依赖于一列Python的行

来自分类Dev

如何使用 Python 从 Pandas 数据框中删除一列？

来自分类Dev

Python Pandas DataFrame-如何基于另一列（日期类型）中的部分匹配来对一列中的值求和？

来自分类Dev

如果某一列与值匹配，则从数据框中删除行-Python 3.6

来自分类Dev

在Python中删除一列的相似文本行

来自分类Dev

使用Python中的正则表达式从基于2列的csv文件中删除重复的行

来自分类Dev

python / pandas：基于同一列的一系列求和之和更新一列

来自分类Dev

Python在pandas df中匹配多列，然后删除不匹配的行

来自分类Dev

Python Pandas：如何根据给定条件基于另一列创建列？

来自分类Dev

Python 3.4 - Pandas - 基于包含重复项的另一个数据帧的列提取行

来自分类Dev

Python Pandas DataFrame检查一列的值是否在另一列表中

来自分类Dev

如何用一行代码删除python中的多列？

来自分类Dev

一列需要在Pandas Python中拆分的数据

来自分类Dev

Python：在Pandas数据框中添加一列

来自分类Dev

如何使用Python Pandas根据行将一列数据更改为多列？

来自分类Dev

将一列值填充到从Python的多列中随机选择的另一列值

来自分类常见问题

Python Pandas用第二列对应行中的值替换第一列中的NaN

来自分类Dev

在创建基于前一行的值和Python Pandas的另一列的下一行的值时，如何应用屏蔽？

来自分类Dev

对一列进行分组，然后从另一列中查找重复项，然后在Python中返回指示

来自分类Dev

Python：基于另一列长度的条件列

Related 相关文章

文章

热门标签

归档