Python - 将 .readlines() 与 .rstrip() 一起使用,然后将所有单词存储到列表中

ML耶稣

我希望能够从包含 120,000 多个单词的文本文件 (dictionary.txt) 中去除 \n 字符( .rstrip('\n') )。然后计算每一行并返回 txt 文件中的单词数量(每个单词在自己的行上)。然后最后希望将所有单词存储到列表中。

目前,下面的代码返回行数,但不会去除 \n 字符,因此可以将其存储到列表中。

 def lines_count():
        with open('dictionary.txt') as file:
            print (len(file.readlines()))
卡斯拉夫德

如果您想要没有尾随换行符的行列表,您可以使用str.splitlines()方法,在这种情况下,您可以将文件作为字符串读取,file_obj.read()然后使用splitlines()整个字符串。虽然,当open函数已经从你的行中返回一个生成器时,不需要这样的事情(你可以在处理行时简单地去除尾随的换行符)或者只调用str.strip()with amap来创建一个带条线的迭代器:

with open('dictionary.txt'):
    striped_lines = map(str.strip, f)

但是,如果您只想将单词数作为 Pythonic 的方式,您可以在sum函数中使用生成器表达式,如下所示:

with open('dictionary.txt') as f:
    word_count = sum(len(line.split()) for line in f)

请注意,在拆分行时无需剥离新行。

例如

In [14]: 'sd f\n'.split()
Out[14]: ['sd', 'f']

但是如果你仍然想要列表中的所有单词,你可以使用列表理解而不是生成器表达式:

with open('dictionary.txt') as f:
    all_words = [word for line in f for word in line.split()]
    word_count = len(all_words)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何将ser.readline.rstrip()与Python中的简单单词或变量进行比较?

来自分类Dev

Python readlines()将行分为两部分

来自分类Dev

'tuple'对象没有属性'rstrip'python

来自分类Dev

python 上的 rstrip 行为笨拙:'HelloWorld'.rstrip('World') 删除 'He' 之后的所有内容

来自分类Dev

readLines将连字符(-)转换为\ x

来自分类Dev

readLines将连字符(-)转换为\ x

来自分类Dev

Python:readlines()方法创建空列表

来自分类Dev

在Python 3中将Ctrl-D与sys.stdin.readlines()结合使用后,如何避免input()出现EOFError?

来自分类Dev

如何在python中遍历readlines()

来自分类Dev

Python readlines 比 read 快

来自分类Dev

python从readlines()中删除与列表不匹配的信息

来自分类Dev

Python readlines() 3.X 到 2.X

来自分类Dev

Python:AttributeError:'str'对象没有属性'readlines'

来自分类Dev

python:rstrip一个确切的字符串,遵守顺序

来自分类Dev

python:rstrip一个确切的字符串,遵守顺序

来自分类Dev

在python中使用strip()或rstrip()删除字符串末尾的空格

来自分类Dev

使用python将列表存储到csv文件中

来自分类Dev

对会话对象“喜欢readlines()”(Python)

来自分类Dev

Python readline和readlines行为

来自分类Dev

Python readline和readlines行为

来自分类Dev

使用Python请求无法将所有数据存储到Django数据库中

来自分类Dev

在python中,如何删除也使用换行符的打印中的最后一个字符?试过 rstrip()

来自分类Dev

如何将输出从readLines转换为R中的数据帧

来自分类Dev

导入模块以将类分组在一起是否有缺点,而不是将所有类放入Python中的一个文件中?

来自分类Dev

'tuple'对象没有属性'rstrip'

来自分类Dev

readlines() 的输出到列表中

来自分类Dev

使用.readlines()并努力访问列表

来自分类Dev

使用Python中的readlines()函数检查下一行的条件

来自分类Dev

将两个列表一起压缩-Python

Related 相关文章

  1. 1

    如何将ser.readline.rstrip()与Python中的简单单词或变量进行比较?

  2. 2

    Python readlines()将行分为两部分

  3. 3

    'tuple'对象没有属性'rstrip'python

  4. 4

    python 上的 rstrip 行为笨拙:'HelloWorld'.rstrip('World') 删除 'He' 之后的所有内容

  5. 5

    readLines将连字符(-)转换为\ x

  6. 6

    readLines将连字符(-)转换为\ x

  7. 7

    Python:readlines()方法创建空列表

  8. 8

    在Python 3中将Ctrl-D与sys.stdin.readlines()结合使用后,如何避免input()出现EOFError?

  9. 9

    如何在python中遍历readlines()

  10. 10

    Python readlines 比 read 快

  11. 11

    python从readlines()中删除与列表不匹配的信息

  12. 12

    Python readlines() 3.X 到 2.X

  13. 13

    Python:AttributeError:'str'对象没有属性'readlines'

  14. 14

    python:rstrip一个确切的字符串,遵守顺序

  15. 15

    python:rstrip一个确切的字符串,遵守顺序

  16. 16

    在python中使用strip()或rstrip()删除字符串末尾的空格

  17. 17

    使用python将列表存储到csv文件中

  18. 18

    对会话对象“喜欢readlines()”(Python)

  19. 19

    Python readline和readlines行为

  20. 20

    Python readline和readlines行为

  21. 21

    使用Python请求无法将所有数据存储到Django数据库中

  22. 22

    在python中,如何删除也使用换行符的打印中的最后一个字符?试过 rstrip()

  23. 23

    如何将输出从readLines转换为R中的数据帧

  24. 24

    导入模块以将类分组在一起是否有缺点,而不是将所有类放入Python中的一个文件中?

  25. 25

    'tuple'对象没有属性'rstrip'

  26. 26

    readlines() 的输出到列表中

  27. 27

    使用.readlines()并努力访问列表

  28. 28

    使用Python中的readlines()函数检查下一行的条件

  29. 29

    将两个列表一起压缩-Python

热门标签

归档