如何从 .vcf 文件中删除错误的制表符/换行符？

debugcn 发表于 Dev

尼恩克·梅克斯

我正在处理一个 vcf 文件。我尝试从此文件中提取信息，但该文件的格式有误。

在这个文件中有一个包含长字符串的列。错误是，该列的某些行中错误地放置了许多制表符和换行符。因此，当我尝试读取此制表符分隔的文件时，所有列都被弄乱了。

我有一个想法如何解决这个问题，但不知道如何在代码中执行它。字符串是 DNA，所以总是有 ATCG。基本上，如果可以在字符 ATCG 中查找多个制表符和换行符并将其删除，则该文件已修复：

ACTGCTGA\t\t\t\t\nCTGATCGA 将变为：ACTGCTGACTGATCGA

因此，需要查看此文件，查找 [ACTG] 后跟制表符或换行符，然后是更多 [ACTG]，然后将其替换为空。知道如何做到这一点吗？

with open(file.vcf, 'r') as f:
    lines = [l for l in f if not l.startswith('##')]

本·帕普

这是使用正则表达式的一种方法：

首先读取文件：

import re

with open('file.vcf', 'r') as file:
    dnafile = file.read()

然后编写一个包含更改的新文件：

with open('fileNew.vcf', 'w') as file:
    file.write(re.sub("(?<=[ACTG]{2})((\\t)*(\\n)*)(?=[ACTG]{2})", "", dnafile))

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-28

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何从字节数组中删除所有空格，换行符和制表符？

来自分类Dev

如何从CodeIgniter中的视图替换制表符和换行符？

来自分类Dev

如何从CodeIgniter中的视图替换制表符和换行符？

来自分类Dev

如何从jQuery Ajax Data中剥离所有空格（如空格，制表符，换行符）？

来自分类Dev

如何在Android中通过MMS发送VCF文件

来自分类Dev

如何从csv文件中删除换行符？

来自分类Dev

如何用REGEX匹配制表符和换行符而不是空格？

来自分类Dev

如何通过制表符和换行符分割字符串？

来自分类Dev

如何用REGEX匹配制表符和换行符而不是空格？

来自分类Dev

如何让我的 C 程序忽略空格（空格、制表符、换行符）？

来自分类Dev

如何使用plink将vcf文件转换为ped文件？

来自分类Dev

vcf文件导入错误

来自分类Dev

如何创建要在共享表中使用的vCard / vcf文件？

来自分类Dev

如何以编程方式解析联系人.vcf文件？

来自分类Dev

如何将这些.vcf文件同时转换为txt

来自分类Dev

如何将VCF文件导入LibreOffice Calc

来自分类Dev

如何为单个联系人创建 .vcf 文件？

来自分类Dev

如何删除beautifulsoup中的换行符？

来自分类Dev

如何在JTabbedPane中删除“制表符边框”

来自分类Dev

如何递归查找目录树中的所有文件，即每个文件第一行的第一个字符是空格，制表符或换行符？

来自分类Dev

如何从文件中删除空白行（包括制表符和空格）？

来自分类Dev

如何在Python中从input.txt拆分xml标记，然后很好地格式化它们（制表符，换行符，嵌套）？

来自分类Dev

如何解析字符串以在Java中的花括号/方括号后添加换行符和制表符

来自分类Dev

如何在VCF文件中删除特定模式后的每一行的其余部分？

来自分类Dev

如何在Spark中处理制表符分隔的文件？

来自分类Dev

如何使用ResponseBody传递详细字符串，包括换行符和制表符

来自分类Dev

如何使用正则表达式验证动态制表符和换行符分隔的字符串？

来自分类Dev

如何使用ResponseBody传递详细字符串，包括换行符和制表符

来自分类Dev

从MySQL表中删除制表符，换行符等

Related 相关文章

文章