python中的复杂正则表达式匹配

Medici 发表于 Dev

美第奇

我有一个txt文件，其中包含以下数据：

ATGCCTTGGGCAACGGT ...（多行）

出租

AGGTTGGCCAAGGTT ...（多行）

我想先找到“ chrI”，然后遍历ATGC的多行，直到找到第x个字符。然后我要打印第x个字符，直到第y个字符。我一直在使用正则表达式，但是一旦找到了包含chrI的行，我就不知道如何继续迭代以找到xth字符。

这是我的代码：

for i, line in enumerate(sacc_gff):
    for match in re.finditer(chromo_val, line):
        print(line)
        for match in re.finditer(r"[ATGC]{%d},{%d}\Z" % (int(amino_start), int(amino_end)), line):
            print(match.group())

变量的含义是：

chromo_val = hrI

amino_start =（我的程序找到了一些起点）

amino_end =（我的程序找到了一些终点）

注意：amino_start并且amino_end需要采用可变形式。

请让我知道是否可以为您澄清任何事情，谢谢。

亲和力

看来您正在使用fasta数据，因此我会在此提供一个答案，但是如果不是这样，您仍然可以使用sub_sequence选择部分。

fasta_data = {} # creates an empty dictionary
with open( fasta_file, 'r' ) as fh:
    for line in fh:
        if line[0] == '>':
            seq_id = line.rstrip()[1:] # strip newline character and remove leading '>' character
            fasta_data[seq_id] = ''
        else:
            fasta_data[seq_id] += line.rstrip()

# return substring from chromosome 'chrI' with a first character at amino_start up to but not including amino_end
sequence_string1 = fasta_data['chrI'][amino_start:amino_end]
# return substring from chromosome 'chrII' with a first character at amino_start up to and including amino_end
sequence_string2 = fasta_data['chrII'][amino_start:amino_end+1]

固定格式：

>chr1
ATTTATATATAT
ATGGCGCGATCG
>chr2
AATCGCTGCTGC

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-21

我来说两句

0条评论

登录后参与评论

来自分类Dev

正则表达式在python中匹配并替换

来自分类Dev

在Python正则表达式中匹配\ [\]

来自分类Dev

复杂正则表达式与捕获组匹配

来自分类Dev

在python中匹配正则表达式

来自分类Dev

Python中的正则表达式-多行匹配

来自分类Dev

正则表达式用于Python中的匹配括号

来自分类Dev

在Python中搜索/匹配正则表达式

来自分类Dev

在表达式中是否可选地与Python正则表达式匹配？

来自分类Dev

Python中的正则表达式无法正确匹配

来自分类Dev

使用正则表达式匹配Python中的单词

来自分类Dev

HTML文件中的Python正则表达式匹配

来自分类Dev

在python正则表达式中匹配复杂的表达式

来自分类Dev

python中的正则表达式与单词不匹配

来自分类Dev

Python中的正则表达式匹配问题

来自分类Dev

python中的正则表达式以匹配Twitter句柄

来自分类Dev

php正则表达式复杂匹配

来自分类Dev

正则表达式的正则表达式在Python中不匹配

来自分类Dev

正则表达式模式无法在python中匹配

来自分类Dev

将长而复杂的版本号与python中的正则表达式匹配

来自分类Dev

在Python正则表达式中匹配\ [\]

来自分类Dev

复杂正则表达式与捕获组的匹配

来自分类Dev

在python中匹配正则表达式

来自分类Dev

python中的正则表达式匹配

来自分类Dev

Python中的正则表达式无法正确匹配

来自分类Dev