如何在R中的数据框中合并特定列的重复行

debugcn 发表于 Dev

吉他独奏

给定R中的数据帧，如下所示

  gen  avg_ep   avgin avg_out avg_gape avg_buc      var_ep      var_in
1   0 117.189 6.09058 16.8925  14.3930 20.2136 0.000600300 0.000646235
2   1 117.188 6.09151 16.8900  14.3880 20.2048 0.000607196 0.000619780
3   2 117.189 6.09269 16.8905  14.3860 20.2033 0.000654027 0.000745787
4   3 117.192 6.09648 16.8920  14.3875 20.2068 0.000625242 0.000767313
5   4 117.193 6.09795 16.8910  14.3854 20.2036 0.000680661 0.000943054
6   5 117.197 6.10452 16.8949  14.3887 20.2091 0.000833197 0.001068240
7   2 1.197 2 474.00  131.1 210.2091 101.000833197 01.068240

我想通过获取具有已存在gen值的行并将它们与重复的行组合，然后将其其他值的平均值分配给其他列来转换数据框。那种嘴巴充满，最好通过一个例子来解决。

使用前一个数据帧，您可以看到最后一行（第7行）的gen值为2。我希望该行与gen值为3（第3行）的另一行合并，然后希望第3行的列值（avg_ep，avgin等）成为两者的均值。例如，第3行的avg_ep应该变为（1.197 + 117.189）/ 2。

另外，我也将数据拆分为一堆没有重复的gen值的数据框，并且我一直在合并它们以获得上面的数据框，现在正试图弄清楚如何组合它们。如果您能想到在合并过程中合并重复项的方法，请告诉我。

夏普

您可以在R或dplyr套件中执行此操作。

读取数据：

df <- read.table(header=TRUE, text="gen  avg_ep   avgin avg_out avg_gape avg_buc      var_ep      var_in
0 117.189 6.09058 16.8925  14.3930 20.2136 0.000600300 0.000646235
1 117.188 6.09151 16.8900  14.3880 20.2048 0.000607196 0.000619780
2 117.189 6.09269 16.8905  14.3860 20.2033 0.000654027 0.000745787
3 117.192 6.09648 16.8920  14.3875 20.2068 0.000625242 0.000767313
4 117.193 6.09795 16.8910  14.3854 20.2036 0.000680661 0.000943054
5 117.197 6.10452 16.8949  14.3887 20.2091 0.000833197 0.001068240
2 1.197 2 474.00  131.1 210.2091 101.000833197 01.068240")

总结以R为基础：

dfbase <- aggregate(. ~ gen, data = df, mean)

总结dplyr：

library(dplyr)
dfdplyr <- df %>%
  group_by(gen) %>%
  summarise_each(funs(mean))

您可以使用以下方法检查它们是否给出相同的结果：

all(dfbase==dfdplyr)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-8

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何在R中的数据框中合并特定列的重复行

来自分类Dev

如何在R中的数据框中合并重复的行

来自分类Dev

如何在新列中为R数据框中的特定行分配类别？

来自分类Dev

如何在R中的数据框中跨多行合并特定数据

来自分类Dev

合并大型数据框中的重复行

来自分类Dev

如何从数据框中的特定列中删除重复的值？

来自分类Dev

如何从R中的数据框中删除重复的列？

来自分类Dev

如何在删除行的同时合并满足条件的数据框中行中的列

来自分类Dev

如何使用 alternative 列合并 R 中的数据框

来自分类Dev

如何在Pyspark数据框的特定行中定位特定列？

来自分类Dev

合并数据框中的行和列

来自分类Dev

按日期/时间从r中两个数据框的合并中删除重复的行

来自分类Dev

R合并数据框中的行

来自分类Dev

如何在R中的数据框的特定列中查找和替换某些关键字？

来自分类Dev

根据R中的列合并数据框

来自分类Dev

R“合并”到数据框中的列

来自分类Dev

如何使用 r 中的列变量实例引用数据框中的特定行？

来自分类Dev

如何合并数据框列中的值

来自分类Dev

在python中合并数据框时出现重复的行

来自分类Dev

如何在Python中对数据框的特定行求和

来自分类Dev

在R中合并具有重复行的多个数据框

来自分类Dev

如何在熊猫数据框的列中搜索特定文本

来自分类Dev

如何从具有重复的R的另一个数据框中更新具有特定列的数据框中的新列？

来自分类Dev

如何在R中动态选择数据框中的列

来自分类Dev

如何在R中以特定格式显示数据框

来自分类Dev

如何在R的数据框的列中查找属于特定范围的项目数

来自分类Dev

如何在R的数据框的列中查找属于特定范围的项目数

来自分类Dev

如何合并在每个变量旁边的列中重复日期变量的数据框

来自分类Dev

如何合并或处理数据框中的重复列？

Related 相关文章

文章

如何在R中的数据框中合并特定列的重复行

如何在R中的数据框中合并特定列的重复行

如何在R中的数据框中合并特定列的重复行

如何在R中的数据框中合并重复的行

如何在新列中为R数据框中的特定行分配类别？

如何在R中的数据框中跨多行合并特定数据

合并大型数据框中的重复行

如何从数据框中的特定列中删除重复的值？

如何从R中的数据框中删除重复的列？

如何在删除行的同时合并满足条件的数据框中行中的列

如何使用 *alternative* 列合并 R 中的数据框

如何在Pyspark数据框的特定行中定位特定列？

合并数据框中的行和列

按日期/时间从r中两个数据框的合并中删除重复的行

R合并数据框中的行

如何在R中的数据框的特定列中查找和替换某些关键字？

根据R中的列合并数据框

R“合并”到数据框中的列

如何使用 r 中的列变量实例引用数据框中的特定行？

如何合并数据框列中的值

在python中合并数据框时出现重复的行

如何在Python中对数据框的特定行求和

在R中合并具有重复行的多个数据框

如何在熊猫数据框的列中搜索特定文本

如何从具有重复的R的另一个数据框中更新具有特定列的数据框中的新列？

如何在R中动态选择数据框中的列

如何在R中以特定格式显示数据框

如何在R的数据框的列中查找属于特定范围的项目数

如何在R的数据框的列中查找属于特定范围的项目数

如何合并在每个变量旁边的列中重复日期变量的数据框

如何合并或处理数据框中的重复列？

如何使用 alternative 列合并 R 中的数据框