在r中找到多列与一列的聚合相关性

syebill 发表于 Dev

西伯利亚

我有一个包含11列的数据框，其中9列是数字。我试图找出8列与其余列的相关性，即8个变量与1个变量的相关性，这应生成一个相关性值，而不是在矩阵中生成9个不同值。

是否有可能？还是我需要在计算单个相关性之后计算平均相关性？例如，我正在尝试查找X，Y，Z与A的相关性。使用上述方法，我得到了一个矩阵，该矩阵为我提供了X的个体相关性得分， Y，Z和A，我需要一个分数，该分数考虑了所有三个X，Y和Z。

出于说明目的，下面提供了模拟的df

          x            y           z   a
1   1.72480753  0.007053053  0.32435032  10
2   0.97227885 -0.844118498 -0.75534119  20
3  -0.53844294 -0.036178789  0.89396765  30
4   1.34695331  0.870119744  0.99400826  40
5   0.02336335  0.514481676  0.95894286  50
6  -0.15239307  0.386061290  0.73541287  60
7  -0.29878116  1.615012645 -0.04416341  70
8  -1.10907706 -1.581093487 -0.93293702  80
9   2.73021114 -0.130141775  1.85304372  90
10  0.22417487  1.170900385 -0.68312974 100

我可以使用a进行每一行和变量的相关，但是我想要的是x，y，z与a的相关

corr.test(df[,1:3],df[,4])

我将感谢您对这个问题的任何帮助。

问候，

迈克·怀斯

皮尔逊相关性定义为一个将一个值的序列（或向量）与另一个值（或向量）关联（查找）的数字。据我所知，一组向量与另一组向量没有大致相等的定义，但是您可以做一些事情，例如取（3个向量中的）平均向量并将其与a相关。

对我来说，至少比取三个相关值的平均值具有更直接的几何意义。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-21

我来说两句

0条评论

登录后参与评论

上一篇：保存Typescript文件时，Visual Studio 2015 RC不会创建源地图

来自分类Dev

Related 相关文章

文章

在r中找到多列与一列的聚合相关性

在r中找到多列与一列的聚合相关性

在R中找到非线性相关性

计算一列与其他列的选择之间的相关性而无循环

计算一列与其他列的选择之间的相关性而无循环

如何计算rollapply中几列和一列之间的滚动相关性？

Leveinshtein 和 hash - 找到一种导致相关性的散列算法（更近的距离）

pandas：在多列中找到字符串后，获取下一列的值

计算 R 数据框列之间的相关性

在R中的每一行中找到最接近第一列中值的值

在与另一列中的特定ID相关联的一列中找到最小值和最大值

如何在R中找到具有值（每行）的最后一列？

如何找到R中每n行的相关性？

如何找到R中每n行的相关性？

确定.find在哪一列中找到结果

在数组的一列中找到最大的数字

在单个文件的每一列中找到公共行

在一列中找到数字总和直到指定的数字

在熊猫中找到一列的最大值

从一列中找到最大值的最快方法是在另一列中找到多个重复项？

在一列的数据框中找到相同的观测值，而在另一列中找到不同的观测值

Python Pandas在另一列的元素列表中找到一列的元素

从一列中找到与另一列相加的值-Pandas

一列中满足条件的列的 R 聚合

如何在大型数据集中找到重要的相关性

R-每列彼此之间的滚动相关性

数据集 R 消除了相关性平均值为 0 的列

R-对于一列中的每个观测值，在另一列中找到最接近的一个

在上一行中找到一列零值，并在第5列中找到对应的值

大熊猫：获取相关性高的列的组合

如何使用基于许多列的bigquery相关性？