删除列中的值与另一个数据集中的列中的值不匹配的所有行

塞巴斯蒂安·泽基(Sebastian Zeki)

我有两个数据集(作为数据框导入)。第一个数据框是沿该染色体的染色体和感兴趣位置的列表(Number,Qual和dt只是其他列)。该数据帧称为sam

  Number   Qual  chr     leftPos     dt
   3        0   chr1    4105086     255
   4       16   chr1    4464364     255
   5       16   chr1    4464390     255
   6       16   chr1    9655049     255
   7       16   chr1    9945004     255
   etc

第二个数据集(称为计数)包含我感兴趣的染色体和该染色体上的位置:

    Chr     Locus
   chr1    4105086
   chr1    4464364

我想删除sam中所有没有对应的Chr和Locus组合计数的行。

输出应如下所示:

Number   Qual  chr     leftPos     dt
3         0   chr1     4105086      255
4        16   chr1     4464364      255

我不想合并,因为我不想在原始数据集(sam)中增加多余的列等,我只想排除基于第一个数据集的行。

肯德基

看看这是您在找什么

# sample data
sam = structure(list(Number = 3:7, Qual = c(0L, 16L, 16L, 16L, 16L), 
    chr = structure(c(1L, 1L, 1L, 1L, 1L), .Label = "chr1", class = "factor"), 
    leftPos = c(4105086L, 4464364L, 4464390L, 9655049L, 9945004L
    ), dt = c(255L, 255L, 255L, 255L, 255L)), .Names = c("Number", 
"Qual", "chr", "leftPos", "dt"), class = "data.frame", row.names = c(NA, 
-5L))

counts = structure(list(Chr = structure(c(1L, 1L), .Label = "chr1", class = "factor"), 
    Locus = c(4105086L, 4464364L)), .Names = c("Chr", "Locus"
), class = "data.frame", row.names = c(NA, -2L))

library(dplyr)
new_data = sam %>% filter(paste0(chr,"_",leftPos) %in%
                            with(counts, paste0(Chr,"_",Locus)))
new_data
#   Number Qual  chr leftPos  dt
# 1      3    0 chr1 4105086 255
# 2      4   16 chr1 4464364 255

或按照建议使用合并

new_data = merge(sam, counts, by.x=c("chr","leftPos"), by.y=c("Chr","Locus"))
new_data = new_data[,c(3,4,1,2,5)]
#   Number Qual  chr leftPos  dt
# 1      3    0 chr1 4105086 255
# 2      4   16 chr1 4464364 255

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

根据另一个数据集中的列值在一个数据框中创建列

来自分类Dev

从列中的另一个数据帧返回具有不同值的行

来自分类Dev

从数据框中删除行,因为另一个数据框中不存在列值

来自分类Dev

根据关键列值熊猫将一个数据框中的行与另一个数据框中的行匹配

来自分类Dev

如何从矩阵中删除与另一个向量中的值匹配的所有行?

来自分类Dev

Python根据另一个数据框中的列值匹配列名

来自分类Dev

Python根据另一个数据框中的列值匹配列名

来自分类Dev

根据条件从 R 中的另一个数据集中添加一个数据集中的列值 - 不同的长度

来自分类Dev

如何基于匹配另一个数据集中的唯一值来从一个数据集中删除行?

来自分类Dev

从数据框中获取所有行,这些行具有来自另一个数据框中的匹配值

来自分类Dev

排除其列包含另一个数据框中的值的行

来自分类Dev

SAS:如果观测值与另一个数据集中的观测值匹配,则将其从数据集中删除

来自分类Dev

从数据框中删除与另一个数据框R中的两列匹配的行

来自分类Dev

迭代数据框中的每个列,将每个值与另一个数据框中的另一列中的值匹配

来自分类Dev

根据另一个数据框的值删除一个数据框的行和列

来自分类Dev

根据来自另一个数据集的列中的匹配字符串来填充列的值

来自分类Dev

查找与另一个数据框中的列具有相同的非唯一列值的数据框中的行

来自分类Dev

根据另一个数据框中的匹配ID替换数据框列值

来自分类Dev

根据匹配的值,使用另一个数据框中的值更新一个数据框中的列

来自分类Dev

计算数据集中的行与R中另一个数据集的所有行之间的差

来自分类Dev

如何将数据帧列的所有元素与另一个数据帧中为该列指定的值相乘?

来自分类Dev

查看一个数据帧行中的所有值是否存在于另一个数据帧中

来自分类Dev

根据id列中的公共值从另一个数据框中减去数据框的行

来自分类Dev

基于 Python 中另一个数据帧的行值从数据帧中获取列?

来自分类Dev

删除包含列1中ID且在Python数据框中的另一个特定列2上至少具有一个特定值的所有行

来自分类Dev

如果前两列都匹配,则将数据框的一列中的值添加到另一个数据框的新列中

来自分类Dev

Python:匹配其他列中的值后,用另一个数据框中的值替换特定列中的NaN

来自分类Dev

替换数据框中的值仅与另一个数据框中匹配的值有关

来自分类Dev

如何删除熊猫数据框中的NaN值,该列的列在另一个数据框中被引用为表示缺少或未知值的编码值

Related 相关文章

  1. 1

    根据另一个数据集中的列值在一个数据框中创建列

  2. 2

    从列中的另一个数据帧返回具有不同值的行

  3. 3

    从数据框中删除行,因为另一个数据框中不存在列值

  4. 4

    根据关键列值熊猫将一个数据框中的行与另一个数据框中的行匹配

  5. 5

    如何从矩阵中删除与另一个向量中的值匹配的所有行?

  6. 6

    Python根据另一个数据框中的列值匹配列名

  7. 7

    Python根据另一个数据框中的列值匹配列名

  8. 8

    根据条件从 R 中的另一个数据集中添加一个数据集中的列值 - 不同的长度

  9. 9

    如何基于匹配另一个数据集中的唯一值来从一个数据集中删除行?

  10. 10

    从数据框中获取所有行,这些行具有来自另一个数据框中的匹配值

  11. 11

    排除其列包含另一个数据框中的值的行

  12. 12

    SAS:如果观测值与另一个数据集中的观测值匹配,则将其从数据集中删除

  13. 13

    从数据框中删除与另一个数据框R中的两列匹配的行

  14. 14

    迭代数据框中的每个列,将每个值与另一个数据框中的另一列中的值匹配

  15. 15

    根据另一个数据框的值删除一个数据框的行和列

  16. 16

    根据来自另一个数据集的列中的匹配字符串来填充列的值

  17. 17

    查找与另一个数据框中的列具有相同的非唯一列值的数据框中的行

  18. 18

    根据另一个数据框中的匹配ID替换数据框列值

  19. 19

    根据匹配的值,使用另一个数据框中的值更新一个数据框中的列

  20. 20

    计算数据集中的行与R中另一个数据集的所有行之间的差

  21. 21

    如何将数据帧列的所有元素与另一个数据帧中为该列指定的值相乘?

  22. 22

    查看一个数据帧行中的所有值是否存在于另一个数据帧中

  23. 23

    根据id列中的公共值从另一个数据框中减去数据框的行

  24. 24

    基于 Python 中另一个数据帧的行值从数据帧中获取列?

  25. 25

    删除包含列1中ID且在Python数据框中的另一个特定列2上至少具有一个特定值的所有行

  26. 26

    如果前两列都匹配,则将数据框的一列中的值添加到另一个数据框的新列中

  27. 27

    Python:匹配其他列中的值后,用另一个数据框中的值替换特定列中的NaN

  28. 28

    替换数据框中的值仅与另一个数据框中匹配的值有关

  29. 29

    如何删除熊猫数据框中的NaN值,该列的列在另一个数据框中被引用为表示缺少或未知值的编码值

热门标签

归档