从具有值列表的列中检索唯一值

分数

我有一个df,其中一栏的值是值的列表。

我的意图是使用此处的某种技术来拆分此列:Pandas将列表的列拆分为多个列

但是,对于列名,我想使用这些值列表中的每个唯一值。

为了检索唯一值,我尝试了三种不同的方法。每个失败都有不同的原因。

当值是值列表时,是否可以获取Series.unique()?

我的三个尝试以及相关的回溯:

1)
unique_vals = splitted_interests.unique()

Traceback (most recent call last):
  File "C:/Users/Mark/PycharmProjects/main/main.py", line 68, in <module>
    unique_vals = splitted_interests.unique()
  File "C:\Users\Mark\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\series.py", line 1991, in unique
    result = super().unique()
  File "C:\Users\Mark\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\base.py", line 1405, in unique
    result = unique1d(values)
  File "C:\Users\Mark\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\algorithms.py", line 405, in unique
    uniques = table.unique(values)
  File "pandas/_libs/hashtable_class_helper.pxi", line 1767, in pandas._libs.hashtable.PyObjectHashTable.unique
  File "pandas/_libs/hashtable_class_helper.pxi", line 1718, in pandas._libs.hashtable.PyObjectHashTable._unique
TypeError: unhashable type: 'list'


2)
unique_vals = splitted_interests.apply(lambda x: x.unique())

Traceback (most recent call last):
  File "C:/Users/Mark/PycharmProjects/main/main.py", line 68, in <module>
    unique_vals = splitted_interests.apply(lambda x: x.unique())
  File "C:\Users\Mark\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\series.py", line 4045, in apply
    mapped = lib.map_infer(values, f, convert=convert_dtype)
  File "pandas/_libs/lib.pyx", line 2228, in pandas._libs.lib.map_infer
  File "C:/Users/Mark/PycharmProjects/main/main.py", line 68, in <lambda>
    unique_vals = splitted_interests.apply(lambda x: x.unique())
AttributeError: 'list' object has no attribute 'unique'

3)
unique_vals = splitted_interests.apply(lambda x: [y.unique() for y in x])

Traceback (most recent call last):
  File "C:\Users\Mark\AppData\Local\Programs\Python\Python37-32\lib\site-packages\pandas\core\series.py", line 4045, in apply
    mapped = lib.map_infer(values, f, convert=convert_dtype)
  File "pandas/_libs/lib.pyx", line 2228, in pandas._libs.lib.map_infer
  File "C:/Users/Mark/PycharmProjects/main/main.py", line 68, in <lambda>
    unique_vals = splitted_interests.apply(lambda x: [y.unique() for y in x])
  File "C:/Users/Mark/PycharmProjects/main/main.py", line 68, in <listcomp>
    unique_vals = splitted_interests.apply(lambda x: [y.unique() for y in x])
AttributeError: 'str' object has no attribute 'unique'

在运行时,带有列表的列如下所示: 在此处输入图片说明

耶斯列尔

对于相同的顺序,请创建字典和extract keys,在python 3.6+中运行的解决方案

df = pd.DataFrame({'JobRoleInterest':['aa,ss,ss','dd,ff','k,dd,dd,dd', 'j,gg']})
splitted_interests = df['JobRoleInterest'].str.split(',')

unique_vals = list(dict.fromkeys([y for x in splitted_interests for y in x]).keys())
print (unique_vals)
['aa', 'ss', 'dd', 'ff', 'k', 'j', 'gg']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在列中添加具有唯一值累计的列

来自分类Dev

SQL查询:检索具有一个列的每个唯一值的条目的行

来自分类Dev

从两列中创建一个具有唯一键和值列表的字典

来自分类Dev

如何从列表中检索最小唯一值?

来自分类Dev

Python / CSV唯一行,列中每行具有唯一值

来自分类Dev

如何为A列中具有共同值的行将唯一值应用于A列

来自分类Dev

如何在 PySpark 中通过具有唯一值的列值标记连续重复项?

来自分类Dev

将具有A和B列的数据框转换为具有唯一B值列表的As列表

来自分类Dev

具有唯一值的圆形Python列表

来自分类Dev

在唯一的项目集和长列表之间创建具有匹配值的新列

来自分类Dev

在列表中存储在Firestore字段中时如何具有键的唯一值

来自分类Dev

如何检索具有特定列值的数组列表?

来自分类Dev

如何使一列在其他列中具有唯一值

来自分类Dev

从词典列表中删除重复项(具有唯一值)

来自分类Dev

Python:筛选具有唯一ID值的列表中的对象

来自分类Dev

从词典列表中删除重复项(具有唯一值)

来自分类Dev

列表中的唯一值

来自分类Dev

熊猫获取B列中每个唯一值的A列中唯一值的列表

来自分类Dev

根据熊猫中其他列的值添加具有唯一标识符的列

来自分类Dev

删除另一列中具有多个唯一值的组

来自分类Dev

唯一值约束,表中具有多个列,而不是Oracle中的组合

来自分类Dev

选择具有唯一列值的行

来自分类Dev

具有唯一值的列的SQL总和金额

来自分类Dev

如何创建具有唯一值的新列

来自分类Dev

SQL:如何更新具有唯一值的列

来自分类Dev

[SQL]:行的唯一子集,其中列值具有一组值中的每一个

来自分类Dev

检索一列具有最大值的行

来自分类Dev

将HashMap列表检索到另一个列表中,一个键具有多个值

来自分类Dev

使具有重复值的列在数据框中唯一

Related 相关文章

  1. 1

    在列中添加具有唯一值累计的列

  2. 2

    SQL查询:检索具有一个列的每个唯一值的条目的行

  3. 3

    从两列中创建一个具有唯一键和值列表的字典

  4. 4

    如何从列表中检索最小唯一值?

  5. 5

    Python / CSV唯一行,列中每行具有唯一值

  6. 6

    如何为A列中具有共同值的行将唯一值应用于A列

  7. 7

    如何在 PySpark 中通过具有唯一值的列值标记连续重复项?

  8. 8

    将具有A和B列的数据框转换为具有唯一B值列表的As列表

  9. 9

    具有唯一值的圆形Python列表

  10. 10

    在唯一的项目集和长列表之间创建具有匹配值的新列

  11. 11

    在列表中存储在Firestore字段中时如何具有键的唯一值

  12. 12

    如何检索具有特定列值的数组列表?

  13. 13

    如何使一列在其他列中具有唯一值

  14. 14

    从词典列表中删除重复项(具有唯一值)

  15. 15

    Python:筛选具有唯一ID值的列表中的对象

  16. 16

    从词典列表中删除重复项(具有唯一值)

  17. 17

    列表中的唯一值

  18. 18

    熊猫获取B列中每个唯一值的A列中唯一值的列表

  19. 19

    根据熊猫中其他列的值添加具有唯一标识符的列

  20. 20

    删除另一列中具有多个唯一值的组

  21. 21

    唯一值约束,表中具有多个列,而不是Oracle中的组合

  22. 22

    选择具有唯一列值的行

  23. 23

    具有唯一值的列的SQL总和金额

  24. 24

    如何创建具有唯一值的新列

  25. 25

    SQL:如何更新具有唯一值的列

  26. 26

    [SQL]:行的唯一子集,其中列值具有一组值中的每一个

  27. 27

    检索一列具有最大值的行

  28. 28

    将HashMap列表检索到另一个列表中,一个键具有多个值

  29. 29

    使具有重复值的列在数据框中唯一

热门标签

归档