如何替换文本文件中的所有新行,制表符和多余的空格

用户名

我有一本书的文本文件,我希望将其读入python程序中,以使用将该文件拆分为句子open("book.txt").read().split(".")

问题在于文件具有新的换行符和多个空格。我希望文件只是由空格分隔的单词,并且所有新行都变成一个空格。

book.txt的当前是这样的(摘要):

To Sherlock Holmes she is always the woman. I have seldom
heard him mention her under any other name. In his eyes she
eclipses and predominates the whole of her sex. It was not that
he felt any emotion akin to love for Irene Adler. All emotions,
and that one particularly, were abhorrent to his cold, precise but
admirably balanced mind. He was, I take it, the most perfect
reasoning and observing machine that the world has seen, but as
a lover he would have placed himself in a false position. He
never spoke of the softer passions, save with a gibe and a sneer.
ZJS

听起来您只是想删除所有换行符和尾随空格...

也许像...

import re
sentences = [re.sub("^\s*|\s*$,"",re.sub("\n","",each))  for each in open("book.txt").read().split(".")]

还是选项卡也有问题...

sentences = [re.sub("^\s*|\s*$","",re.sub("\s+"," ",each))  for each in open("book.txt").read().split(".")]

也可以除以?,!或。使用...

sentences = [re.sub("^\s*|\s*$","",re.sub("\s+"," ",each))  for each in re.split("[\?\.!]",open("book.txt").read())]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何用intellij中的空格序列替换文件中的所有制表符?

来自分类Dev

Python-搜索和替换制表符分隔的文本文件中的相邻文本

来自分类Dev

在R中读取带有制表符和分号的文本文件

来自分类Dev

在python中读取带有制表符和分号的文本文件

来自分类Dev

在所有文件的行末替换空格和制表符

来自分类Dev

读取文本文件并提取制表符和空格分隔的部分

来自分类Dev

删除文本文件所有行中特殊字符后的多余空格

来自分类Dev

如何替换文本文件中的行?

来自分类Dev

如何检查文本文件在bash中是否具有制表符作为其分隔符?

来自分类Dev

查找,解码和替换文本文件中的所有base64值

来自分类Dev

如何在文本文件的每一行前添加行号和制表符?

来自分类Dev

从制表符分隔的文本文件中查找重复的行

来自分类Dev

Excel中带有制表符分隔的文本文件的多个工作表?

来自分类Dev

PHP:从制表符分隔的文本文件中查找而没有while循环

来自分类Dev

如何使Kate用Python文件上的空格缩进,但对文本文件和其他文件使用制表符?

来自分类Dev

如何使Kate用Python文件上的空格缩进,但对文本文件和其他文件使用制表符?

来自分类Dev

从数组中删除空格、制表符和新行

来自分类Dev

将文本文件从双倍空格分隔为制表符分隔

来自分类Dev

使用正则表达式替换文本文件中的所有文本

来自分类Dev

用新行替换文本文件中的行

来自分类Dev

用新行替换文本文件中的行

来自分类Dev

当文件没有标题行时,如何使用Import-CSV导入制表符分隔的文本文件?

来自分类Dev

如何在bash数组中存储由制表符分隔的文本文件中的文件路径

来自分类Dev

解析制表符分隔的文本文件

来自分类Dev

Java替换文本文件中的行

来自分类Dev

Linux替换文本文件中的行

来自分类Dev

Java替换文本文件中的行

来自分类Dev

替换文本文件中的行(最后)bash

来自分类Dev

文本文件中带制表符的分隔符

Related 相关文章

  1. 1

    如何用intellij中的空格序列替换文件中的所有制表符?

  2. 2

    Python-搜索和替换制表符分隔的文本文件中的相邻文本

  3. 3

    在R中读取带有制表符和分号的文本文件

  4. 4

    在python中读取带有制表符和分号的文本文件

  5. 5

    在所有文件的行末替换空格和制表符

  6. 6

    读取文本文件并提取制表符和空格分隔的部分

  7. 7

    删除文本文件所有行中特殊字符后的多余空格

  8. 8

    如何替换文本文件中的行?

  9. 9

    如何检查文本文件在bash中是否具有制表符作为其分隔符?

  10. 10

    查找,解码和替换文本文件中的所有base64值

  11. 11

    如何在文本文件的每一行前添加行号和制表符?

  12. 12

    从制表符分隔的文本文件中查找重复的行

  13. 13

    Excel中带有制表符分隔的文本文件的多个工作表?

  14. 14

    PHP:从制表符分隔的文本文件中查找而没有while循环

  15. 15

    如何使Kate用Python文件上的空格缩进,但对文本文件和其他文件使用制表符?

  16. 16

    如何使Kate用Python文件上的空格缩进,但对文本文件和其他文件使用制表符?

  17. 17

    从数组中删除空格、制表符和新行

  18. 18

    将文本文件从双倍空格分隔为制表符分隔

  19. 19

    使用正则表达式替换文本文件中的所有文本

  20. 20

    用新行替换文本文件中的行

  21. 21

    用新行替换文本文件中的行

  22. 22

    当文件没有标题行时,如何使用Import-CSV导入制表符分隔的文本文件?

  23. 23

    如何在bash数组中存储由制表符分隔的文本文件中的文件路径

  24. 24

    解析制表符分隔的文本文件

  25. 25

    Java替换文本文件中的行

  26. 26

    Linux替换文本文件中的行

  27. 27

    Java替换文本文件中的行

  28. 28

    替换文本文件中的行(最后)bash

  29. 29

    文本文件中带制表符的分隔符

热门标签

归档