使用其他文件中的相同单词替换字符串

何塞·大卫·费尔南德斯(Jose David Fernandez)

我正在寻找编辑我的1.txt文件的方法,以查找一个单词并将其替换为相应的单词,2.txt并添加字符串的其余部分2.txt

我有兴趣维护1.txt文件的顺序

>title1
ID1 .... rest of string I'm not interested in
>title2
ID2 .... rest of string I'm not interested in
>title3
ID3 .... rest of string I'm not interested in
>title....

但是我想添加我的信息2.txt

>ID1  text I want to extract
>ID2  text I want to extract
>ID3  text I want to extract
>IDs....

最后,我希望创建一个具有以下结构的新文件:

>title1
ID1 .... text I want
>title2
ID2 .... text I want
>title3
ID3 .... text I want
>title....

我已经尝试了几个sed命令,但是其中大多数命令都不能完全替换两个文件中的ID#。希望可以在bash中完成

谢谢你的帮助

尝试失败..我的代码是文件1 = cog_anotations.txt,文件2 = Real.cog.txt ID = COG05764,COG 015668等...

sed -e '/COG/{r Real.cog.txt' -e 'd}' cog_anotations.txt
sed "s/^.*COG.*$/$(cat Real.cog.txt)/" cog_anotations.txt
sed -e '/\$COG\$/{r Real.cog.txt'  -e 'd}' cog_anotations.txt
grep -F -f cog_anotations.txt Real.cog.txt > newfile.txt
grep -F -f Real.cog.txt cog_anotations.txt > newfile.txt

实线文件1

>Bravo_5
>CDD:223731 COG0658, ComEC, Predicted membrane metalbinding protein l 
>Bravo_6
>CDD:223242 COG0164, RnhB, Ribonuclease HII [DNA replication, 
>Bravo_7
>CDD:223778 COG0706, YidC, Preprotein translocase subunit YidC .

实线文件2

COG0006    E    Xaa-Pro aminopeptidase
COG0706    J    Glutamyl- or glutaminyl-tRNA synthetase
COG0164    J    tRNA A37 threonylcarbamoyladenosine synthetase subunit 
COG0012    J    Ribosome-binding ATPase YchF, GTP1/OBG family
COG0013    J    Alanyl-tRNA synthetase
bu5hman

awk

awk 'NR==FNR{id[$1","]=$0}
  NR!=FNR{f=$0; getline; if (id[$2]) print f RS id[$2]}' file2 file1

>Bravo_6
COG0164    J    tRNA A37 threonylcarbamoyladenosine synthetase subunit 
>Bravo_7
COG0706    J    Glutamyl- or glutaminyl-tRNA synthetase

演练

id从中file2添加所需文本中的,,以与其他文件匹配来加载数组

awk 'NR==FNR{id[$1","]=$0}

在第二个文件中,NR!=FNR抓取第一行f并跳至第二行getline

  NR!=FNR{f=$0; getline; 

然后测试以查看id所需数组中是否存在该对象,(id[$2])并打印是否存在

  if (id[$2]) print f RS id[$2]}' file2 file1

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在列表中查找内容相同的字符串,避免搜索值是其他单词合并部分的字符串

来自分类Dev

根据其他文件中的列搜索文件中的替换字符串

来自分类Dev

根据其他文件中的列搜索文件中的替换字符串

来自分类Dev

如何用其他文件替换文件中的字符串。

来自分类Dev

在两个子字符串之间替换单词(保留其他单词)

来自分类Dev

在两个子字符串之间替换单词(保留其他单词)

来自分类Dev

使用自制的 strstr() 函数检查其他字符串中的嵌入字符串,然后将其替换为其他字符串(由用户输入)

来自分类Dev

根据其他文件值替换列中的字符串

来自分类Dev

sed替换逗号之间的字符串,并使用其他文件在匹配字段上的输入

来自分类Dev

Python读取文件替换单词中的字符串

来自分类Dev

在文件中多次替换单词之间的字符串

来自分类Dev

使用子字符串的TSQL替换也替换了字符串的其他部分

来自分类Dev

使用子字符串的TSQL替换也替换了字符串的其他部分

来自分类Dev

Python-使用正则表达式用标题中的相同单词替换字符串中的单词

来自分类Dev

使用 JAVA 用其他字符串替换单个字符串中的 2 个部分

来自分类Dev

如何使用嵌套字典替换其他列中的字符串

来自分类Dev

使用python替换列表中的字符串并将其保存为其他变量

来自分类Dev

用 Lua 中的其他字符串替换字符串

来自分类Dev

如何通过python中的.replace方法用其他字符串替换字符串?

来自分类Dev

使用 sed 向文件中的字符串添加其他字符

来自分类Dev

python:替换字符串中的单词

来自分类Dev

替换字符串中的单词

来自分类Dev

随机替换字符串中的单词

来自分类Dev

替换字符串中的单词

来自分类Dev

随机替换字符串中的单词

来自分类Dev

PHP-如何获取以#开头的单词并从字符串中删除其他单词

来自分类Dev

Java中的子字符串操作-查找由其他单词组成的最长单词

来自分类Dev

使用find和grep从文件中查找包含某些字符串但不包含其他字符串的行

来自分类Dev

用其他两个单词替换两个单词字符串不起作用

Related 相关文章

  1. 1

    在列表中查找内容相同的字符串,避免搜索值是其他单词合并部分的字符串

  2. 2

    根据其他文件中的列搜索文件中的替换字符串

  3. 3

    根据其他文件中的列搜索文件中的替换字符串

  4. 4

    如何用其他文件替换文件中的字符串。

  5. 5

    在两个子字符串之间替换单词(保留其他单词)

  6. 6

    在两个子字符串之间替换单词(保留其他单词)

  7. 7

    使用自制的 strstr() 函数检查其他字符串中的嵌入字符串,然后将其替换为其他字符串(由用户输入)

  8. 8

    根据其他文件值替换列中的字符串

  9. 9

    sed替换逗号之间的字符串,并使用其他文件在匹配字段上的输入

  10. 10

    Python读取文件替换单词中的字符串

  11. 11

    在文件中多次替换单词之间的字符串

  12. 12

    使用子字符串的TSQL替换也替换了字符串的其他部分

  13. 13

    使用子字符串的TSQL替换也替换了字符串的其他部分

  14. 14

    Python-使用正则表达式用标题中的相同单词替换字符串中的单词

  15. 15

    使用 JAVA 用其他字符串替换单个字符串中的 2 个部分

  16. 16

    如何使用嵌套字典替换其他列中的字符串

  17. 17

    使用python替换列表中的字符串并将其保存为其他变量

  18. 18

    用 Lua 中的其他字符串替换字符串

  19. 19

    如何通过python中的.replace方法用其他字符串替换字符串?

  20. 20

    使用 sed 向文件中的字符串添加其他字符

  21. 21

    python:替换字符串中的单词

  22. 22

    替换字符串中的单词

  23. 23

    随机替换字符串中的单词

  24. 24

    替换字符串中的单词

  25. 25

    随机替换字符串中的单词

  26. 26

    PHP-如何获取以#开头的单词并从字符串中删除其他单词

  27. 27

    Java中的子字符串操作-查找由其他单词组成的最长单词

  28. 28

    使用find和grep从文件中查找包含某些字符串但不包含其他字符串的行

  29. 29

    用其他两个单词替换两个单词字符串不起作用

热门标签

归档