如何计算连续重复次数并创建具有相应计数ID的列?

碎片

我正在R中进行一些分析,但是我需要计算连续的重复次数,并把ID放在一起。如果有相似的ID,我不想汇总,而当连续重复时,我想聚合特定的ID。我有一个包含这些条目的文件。

Probe Set ID    Call Codes  Chromosomal Position
SNP_A-2131660   BB           1156131
SNP_A-1967418   AB           2234251
SNP_A-1969580   BB           2329564
SNP_A-4263484   BB           2553624
SNP_A-1978185   AA           2936870
SNP_A-4264431   AA           2951834
SNP_A-1980898   BB           3095126
SNP_A-1983139   AA           3165267
SNP_A-4265735   AA           3302871
SNP_A-1995832   AA           3705226
SNP_A-1995893   AA           3720965
SNP_A-1997689   BB           3763164
SNP_A-1997709   AA           3763567
SNP_A-1997896   AA           3766240
SNP_A-1997922   AA           3766286
SNP_A-2000230   AA           4340877
SNP_A-2000332   AB           4343434

我想计算连续值(即BB,AB,(BB,BB)),如果还有其他两列的总和。

我尝试了不同的方法,但是我只能使用R中的此代码来执行连续重复计数。

# I got the counts
dfAA <- as.data.frame(with(rle(myfile$Call.Codes), lengths[values == "AA"]))
# I got the counts and the counted values
dfAA_02<-as.data.frame(rev(unclass(rle(myfile$Call.Codes))))

我不知道如何执行第二部分。

那就是我最后想要获得的。

    Counts  Aggregation_probeset_ID Aggregation Chromosomal position
BB  1      SNP_A-2131660                        1156131   
AB  1      SNP_A-1967418                        2234251  
BB  2      SNP_A-1969580, SNP_A-4263484         2329564, 2553624  
AA  2      SNP_A-1978185, SNP_A-4264431         2936870, 2951834  
AA  4      SNP_A-1983139, SNP_A-4265735, SNP_A-1995832, SNP_A-1995893      3165267, 3302871, 3705226, 3720965  

我想在右边获得的文件。

Metariat

这是您要找的东西吗?

library(data.table)
library(dplyr)

data[, lag := shift(Call_Codes, 1L, fill = , type = "lag")]
data[, new_group := if_else(lag != Call_Codes, 1, 0, missing = 1)]
data[, new_group := cumsum(new_group)]
data[, .(counts = .N,
         Aggregation_probeset_ID = paste(Probe_Set_ID , collapse=","),
         Aggregation_Chromosomal_position = paste(Chromosomal_Position , collapse=","))
         , .(Call_Codes, new_group)][, -c('new_group')]

结果:

   Call_Codes counts                                 Aggregation_probeset_ID Aggregation_Chromosomal_position
1:         BB      1                                           SNP_A-2131660                          1156131
2:         AB      1                                           SNP_A-1967418                          2234251
3:         BB      2                             SNP_A-1969580,SNP_A-4263484                  2329564,2553624
4:         AA      2                             SNP_A-1978185,SNP_A-4264431                  2936870,2951834
5:         BB      1                                           SNP_A-1980898                          3095126
6:         AA      4 SNP_A-1983139,SNP_A-4265735,SNP_A-1995832,SNP_A-1995893  3165267,3302871,3705226,3720965
7:         BB      1                                           SNP_A-1997689                          3763164
8:         AA      4 SNP_A-1997709,SNP_A-1997896,SNP_A-1997922,SNP_A-2000230  3763567,3766240,3766286,4340877
9:         AB      1                                           SNP_A-2000332                          4343434

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何连续计算重复次数PHP MYSQLI

来自分类Dev

根据ID的重复次数创建具有多个序列的向量

来自分类Dev

计算A连续重复的次数和重复次数?

来自分类Dev

如何计算总重复次数少?

来自分类Dev

具有最大连续重复次数的加权随机选择

来自分类Dev

如何创建具有重复特定次数的值的列

来自分类Dev

计算重复次数Powershell

来自分类Dev

熊猫:按列分组并计算重复次数

来自分类Dev

计算一列的非重复次数

来自分类Dev

按出现次数计算重复次数

来自分类Dev

除了计数,还有其他方法可以计算字符串中的重复次数吗?

来自分类Dev

具有多个背景且重复次数不同的CSS

来自分类Dev

如何创建带有下划线的其他列表的重复次数的对象列表?

来自分类Dev

如何从现有列表创建字典?键值必须是该键的重复次数

来自分类Dev

如何从短语列表中查找字典中的短语,以及如何使用找到并计数的短语创建数据框。重复数应计算在内

来自分类Dev

删除重复元素并计算 ArrayList 中的重复次数

来自分类Dev

重复次数累计

来自分类Dev

重复次数

来自分类Dev

如何计算半重复行的出现次数并使计数成为新列

来自分类Dev

Prolog-计算列表中的重复次数

来自分类Dev

使用dplyr和group_by计算值的重复次数

来自分类Dev

SQL QUERY 以 2 个条件计算重复次数

来自分类Dev

如何选择熊猫列中重复次数最多的字段?

来自分类Dev

创建一个计数器,该计数器仅对某个逻辑值进行计数,并且将相同的数字赋予重复次数

来自分类Dev

如何找到连续重复的次数

来自分类Dev

如何找到连续重复的次数

来自分类Dev

计算每条记录出现的重复次数并选择特定列的最小值和最大值

来自分类Dev

SQL选择列值重复次数最多

来自分类Dev

查找没有地图的重复次数最多的整数

Related 相关文章

  1. 1

    如何连续计算重复次数PHP MYSQLI

  2. 2

    根据ID的重复次数创建具有多个序列的向量

  3. 3

    计算A连续重复的次数和重复次数?

  4. 4

    如何计算总重复次数少?

  5. 5

    具有最大连续重复次数的加权随机选择

  6. 6

    如何创建具有重复特定次数的值的列

  7. 7

    计算重复次数Powershell

  8. 8

    熊猫:按列分组并计算重复次数

  9. 9

    计算一列的非重复次数

  10. 10

    按出现次数计算重复次数

  11. 11

    除了计数,还有其他方法可以计算字符串中的重复次数吗?

  12. 12

    具有多个背景且重复次数不同的CSS

  13. 13

    如何创建带有下划线的其他列表的重复次数的对象列表?

  14. 14

    如何从现有列表创建字典?键值必须是该键的重复次数

  15. 15

    如何从短语列表中查找字典中的短语,以及如何使用找到并计数的短语创建数据框。重复数应计算在内

  16. 16

    删除重复元素并计算 ArrayList 中的重复次数

  17. 17

    重复次数累计

  18. 18

    重复次数

  19. 19

    如何计算半重复行的出现次数并使计数成为新列

  20. 20

    Prolog-计算列表中的重复次数

  21. 21

    使用dplyr和group_by计算值的重复次数

  22. 22

    SQL QUERY 以 2 个条件计算重复次数

  23. 23

    如何选择熊猫列中重复次数最多的字段?

  24. 24

    创建一个计数器,该计数器仅对某个逻辑值进行计数,并且将相同的数字赋予重复次数

  25. 25

    如何找到连续重复的次数

  26. 26

    如何找到连续重复的次数

  27. 27

    计算每条记录出现的重复次数并选择特定列的最小值和最大值

  28. 28

    SQL选择列值重复次数最多

  29. 29

    查找没有地图的重复次数最多的整数

热门标签

归档