如何计算python3数据帧中列的频率

雅各布

大家好,我有一个数据框,其中的列是这样的。列:

  • WhiteRating(int)
  • BlackRating(int)
  • NewGameNinePtLead(str, 确定位置是否为“missedMate”、“lostBigLead”、“useless”)
  • 平均评分
  • Rating_Group:X分组评级
  • length_of_checkmate(checkmate 的移动量,int):这是我的y

在这个数据框中,每一行都是一个具有所有这些列属性的观察。我的任务是计算变量P,然后针对 x 回归 p,针对 y 回归 p,最后针对 (x 和 y) P=(具有 y 值且丢失的移动次数)/(具有价值的移动总数y)

我的问题是为我的小组寻找P。我不知道如何以 Pythonic 的方式来处理这个我可以手动循环并计算所有但即使这样我也不确定如何处理它,而且我的数据框的大小可能需要很长时间

WhiteR,BlackR,EMV,MovePlayedValue,NewGame,NinePtLead,AverageRating,Rating_Group,length_of_checkmate
1880.0,1865.0,27.0,27.0,1,useless,1875,1800,0
1880.0,1865.0,22.0,21.0,1,useless,1875,1800,0
1865.0,1880.0,25.0,25.0,1,useless,1875,1800,0
1880.0,1865.0,24.0,19.0,1,useless,1875,1800,0
1865.0,1880.0,22.0,22.0,1,useless,1875,1800,0
1880.0,1865.0,27.0,27.0,1,bigLeadLost,1875,1800,2
杰西卡

如果我正确理解您的问题:您想要导致失败的 y 类型的频率(非零类型),除以 y 的总移动数(y 的类型):

import pandas as pd
import numpy as np

df = {'WhiteR': [1880.0,1880.0,1865.0,1880.0,1865.0,1880.0],\
  'BlackR': [1865.0,1865.0,1880.0,1865.0,1880.0,1865.0],\
  'EMV': [27.0,22.0,25.0,24.0,22.0,27.0,],\
  'MovePlayedValue':[27.0,21.0,25.0,19.0,22.0,27.0,],\
  'NewGame':[1,1,1,1,1,1],\
  'NinePtLead':['useless','useless','useless','useless','useless','bigLeadLost'],\
  'AverageRating':[1875,1875,1875,1875,1875,1875],\
  'Rating_Group':[1800,1800,1800,1800,1800,1800,],\
  'length_of_checkmate':[0,0,0,0,0,2]}


df = pd.DataFrame(df)
status=df['length_of_checkmate'].value_counts().reset_index().rename(columns={'index': 
'length_of_checkmate', 'length_of_checkmate': 'Freq.'})

df1 = pd.merge(df, status, on = ('length_of_checkmate'))
df1['P']= (df1['Freq.']/df1['length_of_checkmate']).replace(np.inf, 0)

#then proceed to 'Regress p against x, regress p against y and finally p against (x and y)'

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何计算 pyspark 数据帧中多列的列中每个分类变量的频率?

来自分类Dev

如何从数据帧python3中获取特定列的Pandas中的用户输入

来自分类Dev

如何计算Python3中未排序的字符串列表中元素的频率?

来自分类Dev

如何计算熊猫数据框中列值更改的频率?

来自分类Dev

如何计算熊猫数据框中列值更改的频率

来自分类Dev

如何计算数据框列中重复值的频率?

来自分类Dev

如何从 Python 中的 3 列数据帧创建矩阵

来自分类Dev

如何为数据帧中的每一行计算分类变量(级别)的频率

来自分类Dev

如何根据R中的因子水平计算数据帧中值的频率?

来自分类Dev

如何循环一个大数据帧并计算频率?

来自分类Dev

计算给定数据帧中项目集的频率

来自分类Dev

计算给定数据帧中项目集的频率

来自分类Dev

计算r中数据帧内变量的相对频率

来自分类Dev

在python中,如何为3个或更多数据帧计算MAX和MIN

来自分类Dev

如何计算熊猫列中变量的频率

来自分类Dev

子集数据帧并计算频率

来自分类Dev

计算数据帧中元素的频率

来自分类Dev

子集数据帧并计算频率

来自分类Dev

如何计算python字典中总值的频率?

来自分类Dev

如何从R中的数据帧制作频率表

来自分类Dev

如何计算数据框列中列表中单词的频率?

来自分类Dev

R:将数据列附加到频率帧基于两列的数据帧中

来自分类Dev

带有频率python的数据帧中的WordCloud

来自分类Dev

Python中数据帧中的计算

来自分类Dev

如何获取R中数据帧的一列中唯一元素的频率?

来自分类Dev

通过单独数据帧中的列内容对数据帧进行子集化 - Python 3

来自分类Dev

两个数据帧的公共列中值的交集 - Pandas,Python3

来自分类Dev

Python3 - 如何按元素的频率对列表进行排序?

来自分类Dev

使用汇总函数计算数据帧中单词的频率

Related 相关文章

  1. 1

    如何计算 pyspark 数据帧中多列的列中每个分类变量的频率?

  2. 2

    如何从数据帧python3中获取特定列的Pandas中的用户输入

  3. 3

    如何计算Python3中未排序的字符串列表中元素的频率?

  4. 4

    如何计算熊猫数据框中列值更改的频率?

  5. 5

    如何计算熊猫数据框中列值更改的频率

  6. 6

    如何计算数据框列中重复值的频率?

  7. 7

    如何从 Python 中的 3 列数据帧创建矩阵

  8. 8

    如何为数据帧中的每一行计算分类变量(级别)的频率

  9. 9

    如何根据R中的因子水平计算数据帧中值的频率?

  10. 10

    如何循环一个大数据帧并计算频率?

  11. 11

    计算给定数据帧中项目集的频率

  12. 12

    计算给定数据帧中项目集的频率

  13. 13

    计算r中数据帧内变量的相对频率

  14. 14

    在python中,如何为3个或更多数据帧计算MAX和MIN

  15. 15

    如何计算熊猫列中变量的频率

  16. 16

    子集数据帧并计算频率

  17. 17

    计算数据帧中元素的频率

  18. 18

    子集数据帧并计算频率

  19. 19

    如何计算python字典中总值的频率?

  20. 20

    如何从R中的数据帧制作频率表

  21. 21

    如何计算数据框列中列表中单词的频率?

  22. 22

    R:将数据列附加到频率帧基于两列的数据帧中

  23. 23

    带有频率python的数据帧中的WordCloud

  24. 24

    Python中数据帧中的计算

  25. 25

    如何获取R中数据帧的一列中唯一元素的频率?

  26. 26

    通过单独数据帧中的列内容对数据帧进行子集化 - Python 3

  27. 27

    两个数据帧的公共列中值的交集 - Pandas,Python3

  28. 28

    Python3 - 如何按元素的频率对列表进行排序?

  29. 29

    使用汇总函数计算数据帧中单词的频率

热门标签

归档