如何从字符串中删除不需要的字符,如空格和换行符

用户2935002

最近,我写了一个python脚本,从数据库中下载序列,如果您提供登录号(例如Rv1617),它将给出如下所示的输出

import wget
import re
from HTMLParser import HTMLParser
e = raw_input("Enter the correct accession number.: ")
y = ''.join([i for i in e if i.isdigit()])
#print y
url = "http://tuberculist.epfl.ch/quicksearch.php?gene+name="+y+"&submit=Search#sequence"
#print url
filname = wget.download(url)
a = open(filname,'r')
b = a.readlines()
f = "|"+e+"|"

for c in b:
    if f in c:
        #x = c
        pattern = re.compile("> >.+<br /></")
        z = pattern.findall(c)
        #print z

class MyHTMLParser(HTMLParser):
    def handle_data(self, data):
        final = ''.join(data)
        andfinal = final.replace(" ","")
        print andfinal,
# instantiate the parser and fed it some HTML

for xz in z:
    parser = MyHTMLParser()
    parser.feed(xz)

它将下载如下序列:

>>>
Enter the correct accession number.:Rv1617

>>M.tuberculosisH37Rv|Rv1617|pykA
VTRRGKIVCTLGPATQRDDLVRALVEAGMDVARMNFSHGDYDDHKVAYERVRVASDATGR
AVGVLADLQGPKIRLGRFASGATHWAEGETVRITVGACEGSHDRVSTTYKRLAQDAVAGD
RVLVDDGKVALVVDAVEGDDVVCTVVEGGPVSDNKGISLPGMNVTAPALSEKDIEDLTFA
LNLGVDMVALSFVRSPADVELVHEVMDRIGRRVPVIAKLEKPEAIDNLEAIVLAFDAVMV
ARGDLGVELPLEEVPLVQKRAIQMARENAKPVIVATQMLDSMIENSRPTRAEASDVANAV
LDGADALMLSGETSVGKYPLAAVRTMSRIICAVEENSTAAPPLTHIPRTKRGVISYAARD
IGERLDAKALVAFTQSGDTVRRLARLHTPLPLLAFTAWPEVRSQLAMTWGTETFIVPKMQ
STDGMIRQVDKSLLELARYKRGDLVVIVAGAPPGTVGSTNLIHVHRIGEDDV

第一行很好,但其余行具有换行符或空格,应在输出中将其删除,并且输出应如下所示:

 >>M.tuberculosisH37Rv|Rv1617|pykA
VTRRGKIVCTLGPATQRDDLVRALVEAGMDVARMNFSHGDYDDHKVAYERVRVASDATGRAVGVLADLQGPKIRLGRFASGATHWAEGETVRITVGACEGSHDRVSTTYKRLAQDAVAGDRVLVDDGKVALVVDAVEGDDVVCTVVEGGPVSDNKGISLPGMNVTAPALSEKDIEDLTFALNLGVDMVALSFVRSPADVELVHEVMDRIGRRVPVIAKLEKPEAIDNLEAIVLAFDAVMV

我已经尝试过:

andfinal = final.replace(" ","")

它适用于空格,但不适用于换行符。

请建议我应该进行哪些更改:

谢谢并恭祝安康

马丁·彼得斯(Martijn Pieters)

在换行符上分割字符串,然后重新加入行:

final_lines = final.splitlines()
final = final_lines[0] + '\n' + ''.join(final_lines[1:])

演示:

>>> final = '''\
... >M. tuberculosis H37Rv|Rv1617|pykA
... VTRRGKIVCTLGPATQRDDLVRALVEAGMDVARMNFSHGDYDDHKVAYERVRVASDATGR
... AVGVLADLQGPKIRLGRFASGATHWAEGETVRITVGACEGSHDRVSTTYKRLAQDAVAGD
... RVLVDDGKVALVVDAVEGDDVVCTVVEGGPVSDNKGISLPGMNVTAPALSEKDIEDLTFA
... LNLGVDMVALSFVRSPADVELVHEVMDRIGRRVPVIAKLEKPEAIDNLEAIVLAFDAVMV
... ARGDLGVELPLEEVPLVQKRAIQMARENAKPVIVATQMLDSMIENSRPTRAEASDVANAV
... LDGADALMLSGETSVGKYPLAAVRTMSRIICAVEENSTAAPPLTHIPRTKRGVISYAARD
... IGERLDAKALVAFTQSGDTVRRLARLHTPLPLLAFTAWPEVRSQLAMTWGTETFIVPKMQ
... STDGMIRQVDKSLLELARYKRGDLVVIVAGAPPGTVGSTNLIHVHRIGEDDV
... '''
>>> final_lines = final.splitlines()
>>> print final_lines[0] + '\n' + ''.join(final_lines[1:])
>M. tuberculosis H37Rv|Rv1617|pykA
VTRRGKIVCTLGPATQRDDLVRALVEAGMDVARMNFSHGDYDDHKVAYERVRVASDATGRAVGVLADLQGPKIRLGRFASGATHWAEGETVRITVGACEGSHDRVSTTYKRLAQDAVAGDRVLVDDGKVALVVDAVEGDDVVCTVVEGGPVSDNKGISLPGMNVTAPALSEKDIEDLTFALNLGVDMVALSFVRSPADVELVHEVMDRIGRRVPVIAKLEKPEAIDNLEAIVLAFDAVMVARGDLGVELPLEEVPLVQKRAIQMARENAKPVIVATQMLDSMIENSRPTRAEASDVANAVLDGADALMLSGETSVGKYPLAAVRTMSRIICAVEENSTAAPPLTHIPRTKRGVISYAARDIGERLDAKALVAFTQSGDTVRRLARLHTPLPLLAFTAWPEVRSQLAMTWGTETFIVPKMQSTDGMIRQVDKSLLELARYKRGDLVVIVAGAPPGTVGSTNLIHVHRIGEDDV

但是,请考虑到FAST格式专门允许换行,并且不错的FASTA格式库可以为您解释字符串。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何删除不需要的空格和换行符

来自分类Dev

重击字符串操作不需要删除换行符

来自分类Dev

重击字符串操作不需要删除换行符

来自分类Dev

如何删除字符串中的空格和换行符

来自分类Dev

如何删除awk中的空格和换行符以插入字符串?

来自分类Dev

尝试构建多个变量的字符串时出现不需要的换行符

来自分类Dev

Flutter 删除字符模式之间的字符串中的空格和换行符

来自分类Dev

如何从字符串的特定部分删除空格和换行符?

来自分类Dev

从字符串 javascript 中删除额外的空格、换行符和 $nbsp

来自分类Dev

如何从python中的字符串中删除空格,换行符等

来自分类Dev

如何从字符串中删除多个换行符

来自分类Dev

如何从字符串中删除换行符?

来自分类Dev

如何从字符串中删除多个换行符

来自分类Dev

从字符串中删除不需要的字符

来自分类Dev

从字符串中删除不需要的字符的函数

来自分类Dev

Java字符串:在换行符之前和之后删除所有其他空格

来自分类Dev

如何从JSON删除不需要的字符串属性

来自分类Dev

从改造响应中删除不需要的字符串

来自分类Dev

从Python中删除字符串中重复的空格,但换行符(\ n)除外

来自分类Dev

如何从Google表格中的字符串中删除不需要的字符

来自分类Dev

如何从PHP中的字符串中删除不需要的字符

来自分类Dev

JavaScript:在XML和JSON字符串中插入换行符和空格?

来自分类Dev

如何在Intellij Idea的代码清除中自动删除不需要的换行符

来自分类Dev

如何用空格和换行符爆炸字符串?

来自分类Dev

如何grep包含空格和换行符的字符串

来自分类Dev

如何使用Linq在换行符和空格处拆分字符串?

来自分类Dev

从C#字符串中删除换行符

来自分类Dev

从字符串PHP中删除换行符

来自分类Dev

如何从 CURL 响应 PHP API 的 JSON 字符串中删除引号、不需要的数据

Related 相关文章

  1. 1

    如何删除不需要的空格和换行符

  2. 2

    重击字符串操作不需要删除换行符

  3. 3

    重击字符串操作不需要删除换行符

  4. 4

    如何删除字符串中的空格和换行符

  5. 5

    如何删除awk中的空格和换行符以插入字符串?

  6. 6

    尝试构建多个变量的字符串时出现不需要的换行符

  7. 7

    Flutter 删除字符模式之间的字符串中的空格和换行符

  8. 8

    如何从字符串的特定部分删除空格和换行符?

  9. 9

    从字符串 javascript 中删除额外的空格、换行符和 $nbsp

  10. 10

    如何从python中的字符串中删除空格,换行符等

  11. 11

    如何从字符串中删除多个换行符

  12. 12

    如何从字符串中删除换行符?

  13. 13

    如何从字符串中删除多个换行符

  14. 14

    从字符串中删除不需要的字符

  15. 15

    从字符串中删除不需要的字符的函数

  16. 16

    Java字符串:在换行符之前和之后删除所有其他空格

  17. 17

    如何从JSON删除不需要的字符串属性

  18. 18

    从改造响应中删除不需要的字符串

  19. 19

    从Python中删除字符串中重复的空格,但换行符(\ n)除外

  20. 20

    如何从Google表格中的字符串中删除不需要的字符

  21. 21

    如何从PHP中的字符串中删除不需要的字符

  22. 22

    JavaScript:在XML和JSON字符串中插入换行符和空格?

  23. 23

    如何在Intellij Idea的代码清除中自动删除不需要的换行符

  24. 24

    如何用空格和换行符爆炸字符串?

  25. 25

    如何grep包含空格和换行符的字符串

  26. 26

    如何使用Linq在换行符和空格处拆分字符串?

  27. 27

    从C#字符串中删除换行符

  28. 28

    从字符串PHP中删除换行符

  29. 29

    如何从 CURL 响应 PHP API 的 JSON 字符串中删除引号、不需要的数据

热门标签

归档