如何总结数据框中的每一列?

塞缪尔·米德克萨

我有以下主题文档概率矩阵的数据框

    0             1         2             3         4       ...             77            78            79            80            81
1  0.0  9.941665e-23  0.001141  6.837607e-04  0.010396      ...       0.000071  6.475626e-10  1.641026e-02  2.494897e-08  2.017094e-02
2  1.0  2.735043e-03  0.004329  1.915713e-20  0.000202      ...       0.005399  1.367521e-02  1.816478e-12  1.641023e-02  1.366020e-10

其中具有值 (0.0, 1.0) 的第 0 列分别表示主题 1 和 2 的索引。数据框有 81 列和 2 行。我想总结所有列并获得另一个数据框。例如,对于第 1 列,对于所有列,输出将为 sum(0.002735042735040934 + 1.7996105239810978e-15)。我用了

col_list = list(df)
df = df[col_list].sum(axis=0)

但它只是打印

1      0.0027350427350409341.7996105239810978e-15
2          0.0054700854694576.284676740939513e-13

这不是我想要输出的输出。正确的做法是什么?在按降序对所有列的每个值进行排序后,我想以这种格式输出每个文档的主题排名。

   id      topic-rank
    1          1, 0
    2          1, 0
    3          0, 1
    4          0, 1
        ...
    80         0, 1
    81         1, 0

这样做的合适方法是什么?

耶斯列

问题是值是字符串,因此需要先将它们转换为floats:

s = df.astype(float).sum()
print (s)
1     0.002735
2     0.005470
80    0.016410
81    0.020171
dtype: float64

编辑:DataFrame.div用于除法:

df = df.astype(float)

df1 = df.div(df.sum())
print (df1)
              1             2        80            81
1  1.000000e+00  1.000000e+00  0.998241  4.151430e-10
2  6.579826e-13  1.148917e-10  0.001759  1.000000e+00

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何根据其中一列中的元素总结熊猫数据框的列

来自分类Dev

如何将数据框中的每一列拆分为两列?

来自分类Dev

如何为数据框中的每一列创建一个csv文件?

来自分类Dev

如何替换数据框中每一列中的所有列表值

来自分类Dev

如何为数据框中的每一列创建多个文本文件并保留第一列?

来自分类Dev

如何使数据框中的每一行的每一列都有一个值?

来自分类Dev

如何在数据框中的每一列上使用grepl?

来自分类Dev

如何计算数据框中每一列每个不同值的出现?

来自分类Dev

如何在R的数据框中计算列表列的每一列中的元素

来自分类Dev

熊猫-如何删除数据框中每一列的空格?

来自分类Dev

如何对数据框中的每一列进行线性回归

来自分类Dev

访问每一行并检查数据框中的每一列值

来自分类Dev

如何将今天的日期放在Python数据框的每一行的第一列中?

来自分类Dev

如何将数据框中的每一列重新缩放为0-100比例?(在r中)

来自分类Dev

如何使用分隔符在数据框中的特定行的每一列中拆分每个值

来自分类Dev

如何将数据框中的每一列重新缩放为0-100比例?(在r中)

来自分类Dev

如何有效地将一个Pandas数据框的每一列与另一数据框的每一列相乘?

来自分类Dev

HoloViews:为pandas数据框中的每一列创建框线图

来自分类Dev

数据中每一列的ggplot

来自分类Dev

如何检查熊猫数据框中的每一列是浮点数还是可以转换为整数

来自分类Dev

如何使用sapply和ggplot2为数据框中的每一列绘制此图?

来自分类Dev

如何将数据框中的每一列转换为具有 ColumnName 和 ColumnValue 的行

来自分类Dev

向数据框列表中的每一列添加列

来自分类Dev

用Python用该列的平均值减去数据框中的每一列

来自分类Dev

向数据框列表中的每一列添加列

来自分类Dev

列出数据框中每一列的唯一值

来自分类Dev

R将数据框中的每一列除以最后一行的值

来自分类Dev

创建一个在每一列中具有随机数的数据框

来自分类Dev

为熊猫数据框的每一行替换一列中的字符串

Related 相关文章

  1. 1

    如何根据其中一列中的元素总结熊猫数据框的列

  2. 2

    如何将数据框中的每一列拆分为两列?

  3. 3

    如何为数据框中的每一列创建一个csv文件?

  4. 4

    如何替换数据框中每一列中的所有列表值

  5. 5

    如何为数据框中的每一列创建多个文本文件并保留第一列?

  6. 6

    如何使数据框中的每一行的每一列都有一个值?

  7. 7

    如何在数据框中的每一列上使用grepl?

  8. 8

    如何计算数据框中每一列每个不同值的出现?

  9. 9

    如何在R的数据框中计算列表列的每一列中的元素

  10. 10

    熊猫-如何删除数据框中每一列的空格?

  11. 11

    如何对数据框中的每一列进行线性回归

  12. 12

    访问每一行并检查数据框中的每一列值

  13. 13

    如何将今天的日期放在Python数据框的每一行的第一列中?

  14. 14

    如何将数据框中的每一列重新缩放为0-100比例?(在r中)

  15. 15

    如何使用分隔符在数据框中的特定行的每一列中拆分每个值

  16. 16

    如何将数据框中的每一列重新缩放为0-100比例?(在r中)

  17. 17

    如何有效地将一个Pandas数据框的每一列与另一数据框的每一列相乘?

  18. 18

    HoloViews:为pandas数据框中的每一列创建框线图

  19. 19

    数据中每一列的ggplot

  20. 20

    如何检查熊猫数据框中的每一列是浮点数还是可以转换为整数

  21. 21

    如何使用sapply和ggplot2为数据框中的每一列绘制此图?

  22. 22

    如何将数据框中的每一列转换为具有 ColumnName 和 ColumnValue 的行

  23. 23

    向数据框列表中的每一列添加列

  24. 24

    用Python用该列的平均值减去数据框中的每一列

  25. 25

    向数据框列表中的每一列添加列

  26. 26

    列出数据框中每一列的唯一值

  27. 27

    R将数据框中的每一列除以最后一行的值

  28. 28

    创建一个在每一列中具有随机数的数据框

  29. 29

    为熊猫数据框的每一行替换一列中的字符串

热门标签

归档