如何遍历数据框,创建新列并在python中为其添加值

sequence_hard

我有以下问题。我有一个包含几列的数据框,其中一列包含字符串作为值。我想遍历此列,更改这些值并将更改后的值保存在新列中。

到目前为止,我编写的代码如下所示:

def get_classes(x):    
    for index, string in df['column'].iteritems():
        listi = string.split(',')
        Classes=[]

        for value in listi:
            count=listi.count(value)
            if count >= 3: 
                Classes.append(value)

        Unique=(',').join(sorted(list(set(Classes))))
        df['NewColumn']=Unique


End.apply(get_classes)

它遍历的行df['column'],在每个行之间拆分字符串,(创建一个名为listi的列表),并创建一个空的list称为类的类。然后,它计算listi中的每个值,如果在列表中至少出现3次,则将其附加到Classes。然后,完成的列表是sortedset(),因此列表中的所有对象都是唯一的,最后再次以逗号连接到字符串。然后,我想将此唯一值列表添加到新列中,该列与更改后的值所源自的行值的索引位置相同。例如:

df
  column    NewColumn
0 A,A,A,C   A 
1 C,B,C,C   C
2 B,B,B,B   B

当我print Unique代替时df['NewColumn']=Unique我的代码似乎运行良好,因为它随后打印了所有转换后的值。但是,如果像我的示例那样执行代码NewColumn,则数据帧的完全用相同的值填充,这似乎与df中最后一行的原始值相对应。有人可以告诉我这里的问题是什么吗?

博维尔上校

您可以使用CounterCollections中的功能强大

from collections import Counter

foo = lambda x: ','.join(sorted([k for k,v in Counter(x).iteritems() if v>=3]))

df['new'] = df['column'].str.split(',').map(foo)


#In [33]: df
#Out[33]:
#    column NewColumn new
#0  A,A,A,C         A   A
#1  C,B,C,C         C   C
#2  B,B,B,B         B   B

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何遍历数据框,创建新列并在python中为其添加值

来自分类Dev

如何遍历数据框中的列值,取均值并创建新的数据框?

来自分类Dev

如何遍历数据框中的列?

来自分类Dev

遍历数据框列表以创建新列

来自分类Dev

在pyspark数据框中遍历两列的同时向新列添加值

来自分类Dev

如何根据 Python 数据框中现有的值向新列添加值?

来自分类Dev

遍历数据框中的列并在同一图形上绘制(Python)

来自分类Dev

如何遍历 R 数据框中的列并在每次迭代中使用列名创建新数据框?

来自分类Dev

如何遍历数据框df中的选定列?

来自分类Dev

如何汇总日内时间戳并在pandas数据框Python中创建新列

来自分类Dev

Pyspark:如何遍历数据框列?

来自分类Dev

遍历数据框中的多列

来自分类Dev

如何编写最有效的方法来为数据框python中的列添加值?

来自分类Dev

R遍历数据框的各列以根据开始结束年份创建新列

来自分类Dev

R遍历数据框的各列以根据开始结束年份创建新列

来自分类Dev

R中数据框为空时如何向列添加值

来自分类Dev

R中数据框为空时如何向列添加值

来自分类Dev

如何遍历数据框中的一列并同时更新两个新列?

来自分类Dev

如何在python中向数据框添加新列,并在其中为d / f行插入d / f值?

来自分类Dev

遍历数据框以添加具有顺序值的新列

来自分类Dev

遍历数据框以添加具有顺序值的新列

来自分类Dev

创建一个新的列,并在另一列中添加值

来自分类Dev

日期时间列操作并在Python中的数据框中创建新列

来自分类Dev

为什么我不能遍历数据框中的新列?

来自分类Dev

遍历数据框将行添加到列pandas python

来自分类Dev

遍历数据框并根据条件将增量值添加到列中

来自分类Dev

如何遍历数组并在 JSX 中显示数据列表?

来自分类Dev

计算值并在新的数据框列中添加引用

来自分类Dev

计算值并在新的数据框列中添加引用

Related 相关文章

  1. 1

    如何遍历数据框,创建新列并在python中为其添加值

  2. 2

    如何遍历数据框中的列值,取均值并创建新的数据框?

  3. 3

    如何遍历数据框中的列?

  4. 4

    遍历数据框列表以创建新列

  5. 5

    在pyspark数据框中遍历两列的同时向新列添加值

  6. 6

    如何根据 Python 数据框中现有的值向新列添加值?

  7. 7

    遍历数据框中的列并在同一图形上绘制(Python)

  8. 8

    如何遍历 R 数据框中的列并在每次迭代中使用列名创建新数据框?

  9. 9

    如何遍历数据框df中的选定列?

  10. 10

    如何汇总日内时间戳并在pandas数据框Python中创建新列

  11. 11

    Pyspark:如何遍历数据框列?

  12. 12

    遍历数据框中的多列

  13. 13

    如何编写最有效的方法来为数据框python中的列添加值?

  14. 14

    R遍历数据框的各列以根据开始结束年份创建新列

  15. 15

    R遍历数据框的各列以根据开始结束年份创建新列

  16. 16

    R中数据框为空时如何向列添加值

  17. 17

    R中数据框为空时如何向列添加值

  18. 18

    如何遍历数据框中的一列并同时更新两个新列?

  19. 19

    如何在python中向数据框添加新列,并在其中为d / f行插入d / f值?

  20. 20

    遍历数据框以添加具有顺序值的新列

  21. 21

    遍历数据框以添加具有顺序值的新列

  22. 22

    创建一个新的列,并在另一列中添加值

  23. 23

    日期时间列操作并在Python中的数据框中创建新列

  24. 24

    为什么我不能遍历数据框中的新列?

  25. 25

    遍历数据框将行添加到列pandas python

  26. 26

    遍历数据框并根据条件将增量值添加到列中

  27. 27

    如何遍历数组并在 JSX 中显示数据列表?

  28. 28

    计算值并在新的数据框列中添加引用

  29. 29

    计算值并在新的数据框列中添加引用

热门标签

归档