使用第三个值的频率作为值创建2个变量矩阵

布料

在这里使用这些数据:

sample  Wu.gene bin other
N1  BA00001 Wolbachia   dontcare6
W30 BA00002 Entomo  dontcare4
N1  BA00002 Rhizobiales dontcare7
N15 BA00002 Rhizobiales dontcare6
W30 BA00004 Bacteriodetes   dontcare1
N15 BA00004 Bacteriodetes   dontcare2
W30 BA00005 Alistepes   dontcare1
N15 BA00005 Alistepes   dontcare1
N15 BA00006 Alistepes   dontcare1
W30 BA00006 Rumino  dontcare6
W30 BA00007 Wolbachia   dontcare6
W30 BA00015 Bacteriodetes   dontcare1
N1  BA00015 Rhizobiales2    dontcare6
N15 BA00015 Wolbachia   dontcare6
N1  BA00016 Entomo  dontcare3
W30 BA00016 Entomo  dontcare5
W30 BA00017 Alistepes   dontcare1
W30 BA00018 Rumino  dontcare6
N15 BA00019 Wolbachia   dontcare6
N15 BA00020 Rhizobiales dontcare6
N15 BA00021 Rhizobiales2    dontcare6
N15 BA00022 Entomo  dontcare6
N1  BA00025 Alistepes   dontcare1
W30 BA00025 Rhizobiales dontcare6
W30 BA00025 Rhizobiales dontcare6
N15 BA00025 Wolbachia   dontcare6
N1  BA00026 Rumino  dontcare6
N15 BA00026 Wolbachia   dontcare6
W30 BA00027 Rhizobiales2    dontcare6
N15 BA00031 Wolbachia   dontcare6
N15 BA00033 Wolbachia   dontcare6
N15 BA00033 Wolbachia   dontcare6
N15 BA00033 Wolbachia   dontcare6

我一直在尝试使用变形库和dcast函数创建矩阵

这个想法是制作一个“ bin”〜“ Wu.gene”矩阵(“ https://www.mediafire.com/file/qv9tdnnvwac6xfe/fake_data/file”),但是使用“ sample”作为矩阵值。让我解释:

如果您查看fake.data表,则Wu.gene“ BA00033”在bin“ Wolbachia”中发生3次,而所有3次都在同一“ N15”样本中。但是,Wu.gene“ BA00016”在bin“ Entomo”中出现2次,但在2个不同的样本中出现:“ N1”和“ W30”。

我可以轻松地构造一个Wu.gene〜bin矩阵,该矩阵将向我显示Wu.gene在同一bin中的次数(无论其是否在同一样本中)

bin BA00016 BA00033
Entomo  2   0
Wolbachia   0   3

但是我无法指定,我想要一个矩阵来显示在同一样本中它发生的时间,看起来像这样

bin BA00016 BA00033
Entomo  2   0
Wolbachia   0   1

我试过了

fake<-read.table(fake_data, header=T)
dcast(data=fake, formula=bin ~ Wu.gene, value.var = "sample")

但它不断地给我提供Wu.gene〜bin的出现次数,我不知道如何指定我希望它查看“样本”列中的值

任何帮助将不胜感激!

罗纳克·沙

我认为您可以使用fun.aggregate传递函数来应用,在这种情况下,uniqueN即要计算唯一值。

library(data.table)
dcast(setDT(fake), bin ~ Wu.gene, value.var = "sample", 
      fill = 0, fun.aggregate = uniqueN)

或使用pivot_wider

tidyr::pivot_wider(fake, names_from = Wu.gene, values_from = sample, 
                   values_fn = n_distinct, id_cols = bin, values_fill = 0)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何为第三个值创建循环?

来自分类Dev

替换第三个值

来自分类Dev

创建新变量作为另一个变量的第一个值,按第三个变量排序

来自分类Dev

交换两个变量的值而不使用第三个one-Array

来自分类Dev

rxJs三个可观测值,前两个响应作为第三个参数

来自分类Dev

sql计算2个值共享第三个值的次数

来自分类Dev

交换两个变量的值而无需使用第三个one-Array

来自分类Dev

非捕获组:删除第三个值

来自分类Dev

mpandroidchart 我想获得第三个值

来自分类Dev

使用Java中的第三个变量交换

来自分类Dev

使用Java中的第三个变量交换

来自分类Dev

给定第三个键,如何在字典中交换2个值?

来自分类Dev

使用指针变量分配数组元素值时,第三个数组元素不打印

来自分类Dev

在第三个矩阵的序列之后分别对2个矩阵进行排名

来自分类Dev

如何根据第三个变量更新频率表?

来自分类Dev

Python-矩阵,两个变量的和取决于第三个

来自分类Dev

在python中合并2个Linkedlists不起作用。创建的第三个链表在执行后给我一个NULL值/结果

来自分类Dev

SQL-2个表值将按第三个未连接值分组

来自分类Dev

SQL-2个表值将按第三个未连接值分组

来自分类Dev

Oracle SQL触发器在插入/更新时计算2个值并更新第三个值

来自分类Dev

在第三个映射/联接表中给定值的情况下,从2个表中检索值

来自分类Dev

通过将两个列表中的值组合来创建第三个列表

来自分类Dev

按两个值分组并计算第三个值

来自分类Dev

gnuplot-使用线条颜色作为第三个变量不会生成所需的输出

来自分类Dev

是否有必要交换两个变量而不使用第三个变量?

来自分类Dev

如何乘以数组值并存储在codeigniter中的第三个数组变量中

来自分类Dev

Matplotlib散点图/颜色作为第三个变量的函数/对称对数色标

来自分类Dev

在Python中重新创建R图-根据第三个值的范围更改颜色

来自分类Dev

通过比较两个字典的值来创建第三个字典

Related 相关文章

  1. 1

    如何为第三个值创建循环?

  2. 2

    替换第三个值

  3. 3

    创建新变量作为另一个变量的第一个值,按第三个变量排序

  4. 4

    交换两个变量的值而不使用第三个one-Array

  5. 5

    rxJs三个可观测值,前两个响应作为第三个参数

  6. 6

    sql计算2个值共享第三个值的次数

  7. 7

    交换两个变量的值而无需使用第三个one-Array

  8. 8

    非捕获组:删除第三个值

  9. 9

    mpandroidchart 我想获得第三个值

  10. 10

    使用Java中的第三个变量交换

  11. 11

    使用Java中的第三个变量交换

  12. 12

    给定第三个键,如何在字典中交换2个值?

  13. 13

    使用指针变量分配数组元素值时,第三个数组元素不打印

  14. 14

    在第三个矩阵的序列之后分别对2个矩阵进行排名

  15. 15

    如何根据第三个变量更新频率表?

  16. 16

    Python-矩阵,两个变量的和取决于第三个

  17. 17

    在python中合并2个Linkedlists不起作用。创建的第三个链表在执行后给我一个NULL值/结果

  18. 18

    SQL-2个表值将按第三个未连接值分组

  19. 19

    SQL-2个表值将按第三个未连接值分组

  20. 20

    Oracle SQL触发器在插入/更新时计算2个值并更新第三个值

  21. 21

    在第三个映射/联接表中给定值的情况下,从2个表中检索值

  22. 22

    通过将两个列表中的值组合来创建第三个列表

  23. 23

    按两个值分组并计算第三个值

  24. 24

    gnuplot-使用线条颜色作为第三个变量不会生成所需的输出

  25. 25

    是否有必要交换两个变量而不使用第三个变量?

  26. 26

    如何乘以数组值并存储在codeigniter中的第三个数组变量中

  27. 27

    Matplotlib散点图/颜色作为第三个变量的函数/对称对数色标

  28. 28

    在Python中重新创建R图-根据第三个值的范围更改颜色

  29. 29

    通过比较两个字典的值来创建第三个字典

热门标签

归档