如何快速将Pandas数据框转换为元组列表

电子杂志

我有一个熊猫数据框,如下所示。

thi        0.969378
text       0.969378
is         0.969378
anoth      0.699030
your       0.497120
first      0.497120
book       0.497120
third      0.445149
the        0.445149
for        0.445149
analysi    0.445149

我想将其转换为元组列表,如下所示。

[["this", 0.969378], ["text", 0.969378], ..., ["analysi", 0.445149]]

我的代码如下。

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from nltk import word_tokenize
from nltk.stem.porter import PorterStemmer

def tokenize(text):
    tokens = word_tokenize(text)
    stems = []
    for item in tokens: stems.append(PorterStemmer().stem(item))
    return stems

# your corpus
text = ["This is your first text book", "This is the third text for analysis", "This is another text"]
# word tokenize and stem
text = [" ".join(tokenize(txt.lower())) for txt in text]
vectorizer = TfidfVectorizer()
matrix = vectorizer.fit_transform(text).todense()
# transform the matrix to a pandas df
matrix = pd.DataFrame(matrix, columns=vectorizer.get_feature_names())
# sum over each document (axis=0)
top_words = matrix.sum(axis=0).sort_values(ascending=False)
print(top_words)

我尝试了以下两个选项。

list(zip(*map(top_words.get, top_words)))

我得到了错误 TypeError: cannot do label indexing on <class 'pandas.core.indexes.base.Index'> with these indexers [0.9693779251346359] of <class 'float'>

list(top_words.itertuples(index=True))

我得到错误为AttributeError: 'Series' object has no attribute 'itertuples'

请让我知道在熊猫中进行此操作的快速方法。

如果需要,我很乐意提供更多详细信息。

耶斯列尔

zip通过索引与映射元组一起使用到列表:

a = list(map(list,zip(top_words.index,top_words)))

或将索引转换为列,转换为nupy数组,然后转换为列表:

a = top_words.reset_index().to_numpy().tolist()

print (a)
[['thi', 0.9693780000000001], ['text', 0.9693780000000001], 
 ['is', 0.9693780000000001], ['anoth', 0.69903], 
 ['your', 0.49712], ['first', 0.49712], ['book', 0.49712],
 ['third', 0.44514899999999996], ['the', 0.44514899999999996],
 ['for', 0.44514899999999996], ['analysi', 0.44514899999999996]]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何快速将熊猫数据框行转换为ordereddict

来自分类Dev

将元组列表转换为MultiIndex Pandas数据框

来自分类Dev

将Pandas数据框转换为元组列表

来自分类Dev

如何将包含元组列表的字典中的字典转换为pandas数据框

来自分类Dev

如何使用python-pandas快速将数据帧转换为大矩阵?

来自分类Dev

将pandas数据框中的行中的元组列表转换为一个元组列表

来自分类Dev

如何快速将 JSON 转换为结构类型数据?

来自分类Dev

将pandas数据框转换为元组列表,并删除所有pandas数据类型

来自分类Dev

如何快速将Int转换为int?

来自分类Dev

如何快速将NSURL转换为CFURL?

来自分类Dev

如何快速将UInt转换为Int?

来自分类Dev

如何快速将PFFile转换为UIImage?

来自分类Dev

如何在Unicode中将元组的元组转换为python中的pandas数据框

来自分类Dev

如何将unicode中的元组的元组转换为python中的pandas数据框

来自分类Dev

如何快速将列表列表中的项目转换为python中的词典列表?

来自分类Dev

将pandas数据框转换为带有索引的元组列表

来自分类Dev

将pandas数据框转换为唯一元组列表

来自分类Dev

将熊猫数据框转换为命名元组列表

来自分类Dev

Python将字典元组列表转换为数据框

来自分类Dev

在条件下将数据框转换为元组列表

来自分类Dev

将pandas数据框转换为列表

来自分类Dev

在Pandas数据框中将元组转换为多个索引

来自分类Dev

在Pandas数据框中将元组转换为多个索引

来自分类Dev

将大列表转换为数据框的快速方法

来自分类Dev

如何将带有元组键的python字典转换为pandas多索引数据框?

来自分类Dev

如何快速将作为numpy数组的redis字符串值转换为数据帧?

来自分类Dev

快速将因子转换为分类数据中的数字

来自分类Dev

快速将数据转换为UnsafeRawPointer,反之亦然

来自分类Dev

如何使用Pandas快速将数据框中的字符串更改为整数ID?

Related 相关文章

  1. 1

    如何快速将熊猫数据框行转换为ordereddict

  2. 2

    将元组列表转换为MultiIndex Pandas数据框

  3. 3

    将Pandas数据框转换为元组列表

  4. 4

    如何将包含元组列表的字典中的字典转换为pandas数据框

  5. 5

    如何使用python-pandas快速将数据帧转换为大矩阵?

  6. 6

    将pandas数据框中的行中的元组列表转换为一个元组列表

  7. 7

    如何快速将 JSON 转换为结构类型数据?

  8. 8

    将pandas数据框转换为元组列表,并删除所有pandas数据类型

  9. 9

    如何快速将Int转换为int?

  10. 10

    如何快速将NSURL转换为CFURL?

  11. 11

    如何快速将UInt转换为Int?

  12. 12

    如何快速将PFFile转换为UIImage?

  13. 13

    如何在Unicode中将元组的元组转换为python中的pandas数据框

  14. 14

    如何将unicode中的元组的元组转换为python中的pandas数据框

  15. 15

    如何快速将列表列表中的项目转换为python中的词典列表?

  16. 16

    将pandas数据框转换为带有索引的元组列表

  17. 17

    将pandas数据框转换为唯一元组列表

  18. 18

    将熊猫数据框转换为命名元组列表

  19. 19

    Python将字典元组列表转换为数据框

  20. 20

    在条件下将数据框转换为元组列表

  21. 21

    将pandas数据框转换为列表

  22. 22

    在Pandas数据框中将元组转换为多个索引

  23. 23

    在Pandas数据框中将元组转换为多个索引

  24. 24

    将大列表转换为数据框的快速方法

  25. 25

    如何将带有元组键的python字典转换为pandas多索引数据框?

  26. 26

    如何快速将作为numpy数组的redis字符串值转换为数据帧?

  27. 27

    快速将因子转换为分类数据中的数字

  28. 28

    快速将数据转换为UnsafeRawPointer,反之亦然

  29. 29

    如何使用Pandas快速将数据框中的字符串更改为整数ID?

热门标签

归档