我有一个包含11列的数据框,其中9列是数字。我试图找出8列与其余列的相关性,即8个变量与1个变量的相关性,这应生成一个相关性值,而不是在矩阵中生成9个不同值。
是否有可能?还是我需要在计算单个相关性之后计算平均相关性?例如,我正在尝试查找X,Y,Z与A的相关性。使用上述方法,我得到了一个矩阵,该矩阵为我提供了X的个体相关性得分, Y,Z和A,我需要一个分数,该分数考虑了所有三个X,Y和Z。
出于说明目的,下面提供了模拟的df
x y z a
1 1.72480753 0.007053053 0.32435032 10
2 0.97227885 -0.844118498 -0.75534119 20
3 -0.53844294 -0.036178789 0.89396765 30
4 1.34695331 0.870119744 0.99400826 40
5 0.02336335 0.514481676 0.95894286 50
6 -0.15239307 0.386061290 0.73541287 60
7 -0.29878116 1.615012645 -0.04416341 70
8 -1.10907706 -1.581093487 -0.93293702 80
9 2.73021114 -0.130141775 1.85304372 90
10 0.22417487 1.170900385 -0.68312974 100
我可以使用a进行每一行和变量的相关,但是我想要的是x,y,z与a的相关
corr.test(df[,1:3],df[,4])
我将感谢您对这个问题的任何帮助。
问候,
皮尔逊相关性定义为一个将一个值的序列(或向量)与另一个值(或向量)关联(查找)的数字。据我所知,一组向量与另一组向量没有大致相等的定义,但是您可以做一些事情,例如取(3个向量中的)平均向量并将其与a相关。
对我来说,至少比取三个相关值的平均值具有更直接的几何意义。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句