搜索

搜索

从制表符分隔的命令输出中拆分管道分隔列的元素

debugcn 发表于 Dev

5

用户10657934

我正在使用以下命令将具有不规则格式的文本文件解析为具有 10 列的文本文件。

bcftools query -Hf 'CHC2432T\t%TYPE\t%CHROM\t%POS\t%REF\t%ALT\t%ANN[\t%DP\t%AD\t%GT]\n' test.vcf > ttest.txt

结果是一个tab-separated有 10 列的文本文件，但第 7 列（ANN在命令中）包含几个元素，即 | 像这个例子一样分开：

G|intron_variant|MODIFIER|C1orf222|ENSG00000142609|transcript|ENST00000493316|protein_coding

我想得到这个|分隔列的第 4 个元素而不是上面的行（整行）。我正在尝试使用以下命令（添加到上述命令）在 AWK 中执行此操作：

bcftools query -Hf 'CHC2432T\t%TYPE\t%CHROM\t%POS\t%REF\t%ALT\t%ANN[\t%DP\t%AD\t%GT]\n' test.vcf | awk '{printf }' | awk -F "|" '{print $1\t$2\t$3\t$4\t$5\t$6\t$7\t$8\t$9\t$10}' > results.txt

但它没有返回我想要的东西。你知道怎么修吗？

伊尼安

您只需要将您的输出通过管道bcftools传输到awk执行此操作的单个命令

bcftools query -Hf 'CHC2432T\t%TYPE\t%CHROM\t%POS\t%REF\t%ALT\t%ANN[\t%DP\t%AD\t%GT]\n' test.vcf |
    awk -v FS="\t" '{ split($7, arr, "|"); $7 = arr[4] }1'

您可以进一步改进您的awk命令以引入健全性检查，以确保您没有访问越界数组成员

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-29

0

我来说两句

0条评论

登录后参与评论

相关文章

来自分类Dev

是否有用于输出制表符分隔列的简单命令？

来自分类Dev

在制表符分隔的文件中添加值列

来自分类Dev

从Excel中的特定列获取制表符分隔的文本

来自分类Dev

从以逗号分隔的一列和由制表符分隔的文件中打印一个元素

来自分类Dev

将制表符分隔的数据拆分为数组

来自分类Dev

使用awk在两个制表符分隔的列中减去多个逗号分隔的值

来自分类Dev

在Java中从命令行指定制表符分隔符等

来自分类Dev

用制表符/空格分隔输出：Perl

来自分类Dev

计算制表符分隔文件中字符串元素中的单词数

来自分类Dev

sed命令来替换制表符和文本中以空格分隔的单词

来自分类Dev

过滤制表符分隔文件的多列？

来自分类Dev

拆分管道分隔字符串 - Oracle SQL

来自分类Dev

如何使用split对制表符分隔文件中的列总数进行总计（列数未知）？

来自分类Dev

你如何从连续的行中检索文本并在 python 中制作制表符分隔的列？

来自分类Dev

在javascript中解析制表符分隔文件

来自分类Dev

在Perl中解析制表符分隔的文件

来自分类Dev

读取Clojure中的制表符分隔文件

来自分类Dev

将制表符分隔的文件读入C ++中的数组

来自分类Dev

制表符分隔文件中的C＃FileHelpers空

来自分类Dev

使用Python读取Hadoop中制表符分隔的文件

来自分类Dev

从制表符分隔的文件中删除缺少值的行

来自分类Dev

更改Python文件中的值（制表符分隔的列表）

来自分类Dev

如何在Spark中处理制表符分隔的文件？

来自分类Dev

从由制表符分隔的文件中读取记录

来自分类Dev

如何在制表符分隔的文件中查找列数

来自分类Dev

在Python中以制表符分隔的列写入文本文件

来自分类Dev

从制表符分隔的文件中搜索和打印特定的列？

来自分类Dev

使用Powershell编辑制表符分隔的文本文件中的列

来自分类Dev

将1的列添加到制表符分隔的文件中

Related 相关文章

文章

热门标签

归档