根据一列中的输入从一列中获取字符

debugcn 发表于 Dev

精氨酸

我有一个数据框架bp_example，如下所示：

 structure(list(Sequence = c("Sequence", "Sequence", "Sequence", 
"Sequence", "Sequence", "Sequence", "Sequence", "Sequence", "Sequence", 
"Sequence", "Sequence", "Sequence", "Sequence", "Sequence", "Sequence", 
"Sequence", "Sequence", "Sequence", "Sequence", "Sequence", "Sequence", 
"Sequence", "Sequence", "Sequence", "Sequence"), start = c(1, 
2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 
20, 21, 22, 23, 24, 25), end = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 
11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25), 
    score = c(-0.205, -0.229, -0.115, -0.427, -0.327, -0.543, 
    -0.717, -0.923, -1.241, -1.471, -1.737, -1.717, -1.247, -1.137, 
    -0.689, -0.731, -0.337, 0.091, 0.579, 0.93, 0.575, 0.128, 
    -0.036, -0.186, -0.259), residue = c("M", "D", "A", "R", 
    "M", "R", "E", "L", "S", "F", "K", "V", "V", "L", "L", "G", 
    "E", "G", "R", "V", "G", "K", "T", "S", "L"), epitope = c(".", 
    ".", ".", ".", ".", ".", ".", ".", ".", ".", ".", ".", ".", 
    ".", ".", ".", ".", ".", "E", "E", "E", ".", ".", ".", "."
    )), .Names = c("Sequence", "start", "end", "score", "residue", 
"epitope"), class = c("data.table", "data.frame"), row.names = c(NA, 
-25L))

我不确定是否可以做我想做的事，但是无论如何，这是可以的。我要遍历该列，bp_example$epitope并且如果一行中有14个以上的“ E”，即该列中出现“ E”的15个或更多连续行bp_example$epitope，我想在其上添加相应的字符前一列（bp_example$residue）打印为单个字符串（因数）。

考虑到我给出的示例，我想MDARMRELSFKVVLLG打印字符串（最好将其存储为alist或的元素data.frame）。

我试了while循环，但根本没有成功。

阿克伦

这是使用的选项data.table。将'data.frame'转换为'data.table'（setDT(df1)），创建一个run-lengh-id（rleid）列（'grp'，基于'epitome'中出现“ E”值。按'Sequence'和' 'grp'，我们在i（epitome == "E"）中指定逻辑条件，并且（）if的行数.N大于14，然后paste将'residue'元素加在一起

library(data.table)
setDT(df1)[, grp := rleid(epitope=="E")][epitope == "E",
     .(residueConcat = if(.N > 14) paste(trimws(residue), collapse="")), .(Sequence, grp)]

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-7

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

根据一列中的输入从一列中获取字符

根据一列中的输入从一列中获取字符

R-根据另一列中的类别从一列获取总和

R：根据另一列中的值从一列中的拆分字符串中检索数据

如何根据另一列的特定值从一列中删除NaN

根据另一列中的数字输入，用文本填充一列

根据第一列从CSV文件中获取唯一列表

根据一列进行分组，并在另一列中获取总和值

从DataFrame列中获取字符串，并将其分配给pandas中的另一列

如何从一列中获取行值，并根据不同的列值将它们分开，用“ sep”分隔？

将数据框分组到一列，并从一列中获取最大值，并从另一列中获取其对应的值

如何根据在另一列中选择的行数据从一列中收集值？

R dplyr - 根据另一列中特定值的位置从一列中选择值

根据同一工作表另一列中的引用在一列中输入值

根据'_'在Bash中拆分一列

在熊猫中，如何从一列中的唯一值中创建列，然后根据另一列中的值填充它？

SQL。如何从一列中获取价值并将其传递给另一列

在某些行中，从一列获取值并将其分布到另一列

从一列中获取对应于行子集的另一列最小值的值

SQL。如何从一列中获取价值并将其传递给另一列

从一列中获取记录，并将其插入Access中的一行

从一列的列值中列出，然后过滤另一列的值

在Python中从一列创建多列

从一行中的一列检索数据

从一列中删除与另一列中的值相等的值

从关系中仅获取一列

仅获取网站中的一列

第一列中的匹配字符

第一列中的匹配字符

根据另一列中的值，用字符串替换一列中的NaN

根据另一列中的值，将一列中的NaN替换为字符串