分类变量和数字变量之间的相关性:TypeError

仍然在学习

在计算类别变量和数值变量之间的相关性时,我遇到一些问题。我有一个数据集(如下所示的head(5)):

    A     C   Label
0   a1  gt2016  0
1   a2  gt2016  0
2   b13 gt2016  0
3   a5  gt2016  1
4   b12 gt2016  1

我想找到C和Label之间的相关性。由于C包含分类变量,因此我按如下方式使用了虚拟变量:

df_dummies = pd.get_dummies(df['C'])
del df_dummies[df_dummies.columns[-1]]
df_new = pd.concat([df, df_dummies], axis=1)
del df_new['C]

但是,当我按如下方式计算相关性时

x = df_new.values
correlation_matrix = np.corrcoef(x.T)
print(correlation_matrix)

我收到此错误:

TypeError: unsupported operand type(s) for /: 'str' and 'int'

如果我错过了计算相关性以解决问题的步骤,可以给我吗?

卡梅隆·钱德勒

回想一下,相关定义为

r = cov(X,Y)/ sqrt(var(X)var(Y))

因此,由于常数的方差为0,并且C始终为gt2016,因此无法与常数相关。但是假设存在变化,以下代码将用于获取Label与C的每个值之间的相关性:

df = pd.DataFrame({'A': ['a1', 'a2', 'b13', 'a5', 'b12'], 'C': ['gt2016']*4 + ['hi'], 'Label': [0,0,0,1,1]})

df_dummies = pd.get_dummies(df['C'])
df_new = pd.concat([df.drop('C', axis=1), df_dummies], axis=1)
df_new.corr()

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

数据集中的分类变量之间的相关性

来自分类Dev

如何使用双数来计算连续变量和分类变量之间的相关性?

来自分类Dev

如何使用双数来计算连续变量和分类变量之间的相关性?

来自分类Dev

数字变量与逻辑变量之间的相关性是否导致(预期的)错误?

来自分类Dev

查找变量和类变量之间的相关性

来自分类Dev

因变量和自变量之间的相关性

来自分类Dev

查找多个变量在每组行之间的相关性

来自分类Dev

R中仅特定变量之间的相关性

来自分类Dev

2个大小不同的变量之间的MATLAB相关性

来自分类Dev

两组变量之间的相关性

来自分类Dev

R中类似变量的相关性

来自分类Dev

变量和$ watch的AngularJS相关性

来自分类Dev

Python - 与公式的变量相关性

来自分类Dev

如何关联和可视化一个变量与多个变量之间的相关性

来自分类Dev

计算具有NA的线性回归残差与R中的自变量之间的相关性

来自分类Dev

for循环可在2个不同的数据框中查找相同变量(列)之间的相关性

来自分类Dev

如何使用map()函数计算变量之间的Pearson相关性?

来自分类Dev

x与其他两个变量之间的相关性

来自分类Dev

如何获得两个变量之间的相关性滞后

来自分类Dev

如何计算R中所有列之间的相关性并检测高度相关的变量

来自分类Dev

弹性搜索错误 - 变量 [相关性] 未定义

来自分类Dev

python中分类的相关性

来自分类Dev

R中的相关性;数字

来自分类Dev

位数学并掩盖与数字的相关性

来自分类Dev

python中数组之间的相关性

来自分类Dev

不同矩阵之间的相关性R

来自分类Dev

matlab 全局流:生成的数字集之间有任何相关性吗?

来自分类Dev

变量的多个值,介于0和数字序言之间

来自分类Dev

变量的多个值,介于0和数字序言之间

Related 相关文章

  1. 1

    数据集中的分类变量之间的相关性

  2. 2

    如何使用双数来计算连续变量和分类变量之间的相关性?

  3. 3

    如何使用双数来计算连续变量和分类变量之间的相关性?

  4. 4

    数字变量与逻辑变量之间的相关性是否导致(预期的)错误?

  5. 5

    查找变量和类变量之间的相关性

  6. 6

    因变量和自变量之间的相关性

  7. 7

    查找多个变量在每组行之间的相关性

  8. 8

    R中仅特定变量之间的相关性

  9. 9

    2个大小不同的变量之间的MATLAB相关性

  10. 10

    两组变量之间的相关性

  11. 11

    R中类似变量的相关性

  12. 12

    变量和$ watch的AngularJS相关性

  13. 13

    Python - 与公式的变量相关性

  14. 14

    如何关联和可视化一个变量与多个变量之间的相关性

  15. 15

    计算具有NA的线性回归残差与R中的自变量之间的相关性

  16. 16

    for循环可在2个不同的数据框中查找相同变量(列)之间的相关性

  17. 17

    如何使用map()函数计算变量之间的Pearson相关性?

  18. 18

    x与其他两个变量之间的相关性

  19. 19

    如何获得两个变量之间的相关性滞后

  20. 20

    如何计算R中所有列之间的相关性并检测高度相关的变量

  21. 21

    弹性搜索错误 - 变量 [相关性] 未定义

  22. 22

    python中分类的相关性

  23. 23

    R中的相关性;数字

  24. 24

    位数学并掩盖与数字的相关性

  25. 25

    python中数组之间的相关性

  26. 26

    不同矩阵之间的相关性R

  27. 27

    matlab 全局流:生成的数字集之间有任何相关性吗?

  28. 28

    变量的多个值,介于0和数字序言之间

  29. 29

    变量的多个值,介于0和数字序言之间

热门标签

归档