如何从R中的每个组中随机选择两组行

MAPK

我有一个称为的数据框test.data,其中有一个名为的列Ethnicity一共有三个种族(实际数据更多),阿迪格(Adygei),Bal路支(Balochi)和Biaka_pygmies。我想将这个数据框作为子集,以仅包括来自每个种族的两个随机样本(行)并获取result我如何在R中做到这一点?

test.data <-  structure(list(Sample = c("1793102418_A", "1793102460_A", "1793102500_A", 
"1793102576_A", "1749751113_A", "1749751187_A", "1749751189_A", 
"1749751285_A", "1749751356_A", "1749751195_A", "1749751218_A", 
"1775705355_A"), Ethnicity = c("Adygei", "Adygei", "Adygei", 
"Adygei", "Balochi", "Balochi", "Balochi", "Balochi", "Balochi", 
"Biaka_Pygmies", "Biaka_Pygmies", "Biaka_Pygmies"), Height = c(0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)), .Names = c("Sample", "Ethnicity", 
"Height"), row.names = c("1793102418_A", "1793102460_A", "1793102500_A", 
"1793102576_A", "1749751113_A", "1749751187_A", "1749751189_A", 
"1749751285_A", "1749751356_A", "1749751195_A", "1749751218_A", 
"1775705355_A"), class = "data.frame")

结果

                        Sample     Ethnicity Height
    1793102418_A 1793102418_A        Adygei      0
    1793102460_A 1793102460_A        Adygei      0
    1749751189_A 1749751189_A       Balochi      0
    1749751285_A 1749751285_A       Balochi      0
    1749751195_A 1749751195_A Biaka_Pygmies      0
    1775705355_A 1775705355_A Biaka_Pygmies      0
阿克伦

我们可以使用data.table将“ data.frame”转换为“ data.table”(setDT(test.data)),并按“ Ethnicity”分组,我们sample将根据行的顺序对行进行排序并对其进行子集化。

setDT(test.data)[, .SD[sample(1:.N,2)], Ethnicity]

或使用tapplybase R

test.data[ with(test.data, unlist(tapply(seq_len(nrow(test.data)),
                     Ethnicity, FUN = sample, 2))), ]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何找到R中两组数据的p值?

来自分类Dev

如何在R中绘制两组的密度图

来自分类Dev

在python中创建两组互斥的随机样本

来自分类Dev

在postgres表中为每个组选择随机行

来自分类Dev

从前两组中获取前两行

来自分类Dev

Mysql / PHP / Smarty-如何在一行中检索两组不同的行?

来自分类Dev

R中两组观测值的小计总和

来自分类Dev

使用R中的两组节点构建图

来自分类Dev

R中两组的唯一实例

来自分类Dev

如何在单行中设置两组<li>的样式?

来自分类Dev

如何在Google Spreadsheets中减去两组值?

来自分类Dev

选择两组值

来自分类Dev

Python中两组元组的区别

来自分类Dev

Cmake中的两组测试

来自分类Dev

在VBA中合并两组对象

来自分类Dev

在Redis中存储两组表

来自分类Dev

Cmake中的两组测试

来自分类Dev

C中两组的和与异或

来自分类Dev

给定两组向量,如何为第一组中的每个向量找到第二组中最接近的向量?

来自分类Dev

R 中的组与两组使用 spearman 检验的相关性

来自分类Dev

如何使用SQL仅选择每个组中的最新组?

来自分类Dev

在PowerShell中的两组字符之间选择字符串

来自分类Dev

AMPL,从两组数据中选择

来自分类Dev

在awk中选择两组条件

来自分类Dev

Ionic Framework / AngularJS中的两组单选按钮

来自分类Dev

Ionic Framework / AngularJS中的两组单选按钮

来自分类Dev

在O(nlogn)的两组中查找匹配对

来自分类Dev

从两组中各选取一个元素

来自分类Dev

Mongo DB-聚合中两组字段的并集