计算句子中的特定单词

华流

我目前正在尝试解决这个家庭作业问题。

我的任务是实现一个函数,该函数返回给定文本中的字数向量。我需要将文本拆分为单词,然后使用NLTK'stokeniser 来标记每个句子。

这是我到目前为止的代码:

import nltk
import collections
nltk.download('punkt')
nltk.download('gutenberg')
nltk.download('brown')

def word_counts(text, words):
"""Return a vector that represents the counts of specific words in the text
>>> word_counts("Here is sentence one. Here is sentence two.", ['Here', 'two', 'three'])
[2, 1, 0]
>>> emma = nltk.corpus.gutenberg.raw('austen-emma.txt')
>>> word_counts(emma, ['the', 'a'])
[4842, 3001]
"""

from nltk.tokenize import TweetTokenizer
text = nltk.sent_tokenize(text)
words = nltk.sent_tokenize(words)

wordList = []

for sen in text, words:
    for word in nltk.word_tokenize(sen):

        wordList.append(text, words).split(word)

counter = TweetTokenizer(wordList)
return counter

有两个 doctest 应该给出以下结果:[2, 1, 0] 和 [4842, 3001]

这是我从我的代码中得到的错误信息 在此处输入图片说明

我花了一整天的时间试图解决这个问题,我觉得我已经接近了,但我不知道我做错了什么,脚本每次都给我一个错误。

任何帮助将不胜感激。谢谢你。

帕特里克·阿特纳
import nltk
import collections
from nltk.tokenize import TweetTokenizer
# nltk.download('punkt')
# nltk.download('gutenberg')
# nltk.download('brown')

def word_counts(text, words):
    """Return a vector that represents the counts of specific words in the text
    word_counts("Here is sentence one. Here is sentence two.", ['Here', 'two', 'three'])
    [2, 1, 0]
    emma = nltk.corpus.gutenberg.raw('austen-emma.txt')
    word_counts(emma, ['the', 'a'])
    [4842, 3001]
    """  

    textTok = nltk.word_tokenize(text) 
    counts =  nltk.FreqDist(textTok)   # this counts all word occurences

    return [counts[x] or 0 for x in words] # this returns what was counted for *words

r1 = word_counts("Here is sentence one. Here is sentence two.", ['Here', 'two', 'three'])
print(r1) #    [2, 1, 0]

emma = nltk.corpus.gutenberg.raw('austen-emma.txt')
r2 = word_counts(emma, ['the', 'a'])
print(r2) # [4842, 3001]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

计算句子haskell中特定单词的出现

来自分类Dev

从bash句子中删除特定单词?

来自分类Dev

PHP-从句子中删除特定单词

来自分类Dev

查找句子中是否不包含特定单词

来自分类Dev

如何从powershell中的句子打印特定单词

来自分类Dev

如何在 Python 的句子中收集特定单词?

来自分类Dev

如何在Python的数据框中计算段落中每个句子中特定单词的出现次数

来自分类Dev

在Python中查找特定单词的句子索引(列表中的句子)

来自分类Dev

如何排除包含特定单词的句子

来自分类Dev

提取包含特定单词的句子

来自分类Dev

如何排除包含特定单词的句子

来自分类Dev

将句子中的特定单词加粗,但不要突出显示“,Lead Bookrunner”之前的整个句子

来自分类Dev

PHP Regex将句子中的单词与其他某些特定单词匹配(可选)

来自分类Dev

计算其他数组中的特定单词

来自分类Dev

计算R中的特定单词频率

来自分类Dev

如何计算txt文件中特定单词出现的行数?

来自分类Dev

计算文本文件中的特定单词-Java

来自分类Dev

使用awk计算文本中特定单词的实例

来自分类Dev

用python计算rdd中的特定单词

来自分类Dev

计算php字符串中特定单词的数量

来自分类Dev

使用REGEX获取句子中不包含特定单词的特定字符串?

来自分类Dev

如何使用批处理脚本从特定句子中过滤特定单词?

来自分类Dev

如何从文本文件中的句子中删除特定单词?

来自分类Dev

如何在RPGLE中找到句子中特定单词的起始位置

来自分类Dev

如何从SQL数据库中的句子中提取特定单词?

来自分类Dev

从文本文件中打印以特定单词或字符开头和结尾的句子?

来自分类Dev

如果标题有特定单词,则句子中的 preg_match 字符串

来自分类Dev

如何在阅读C中的特定单词后阅读整个句子

来自分类Dev

从句子中删除选定单词以外的单词

Related 相关文章

  1. 1

    计算句子haskell中特定单词的出现

  2. 2

    从bash句子中删除特定单词?

  3. 3

    PHP-从句子中删除特定单词

  4. 4

    查找句子中是否不包含特定单词

  5. 5

    如何从powershell中的句子打印特定单词

  6. 6

    如何在 Python 的句子中收集特定单词?

  7. 7

    如何在Python的数据框中计算段落中每个句子中特定单词的出现次数

  8. 8

    在Python中查找特定单词的句子索引(列表中的句子)

  9. 9

    如何排除包含特定单词的句子

  10. 10

    提取包含特定单词的句子

  11. 11

    如何排除包含特定单词的句子

  12. 12

    将句子中的特定单词加粗,但不要突出显示“,Lead Bookrunner”之前的整个句子

  13. 13

    PHP Regex将句子中的单词与其他某些特定单词匹配(可选)

  14. 14

    计算其他数组中的特定单词

  15. 15

    计算R中的特定单词频率

  16. 16

    如何计算txt文件中特定单词出现的行数?

  17. 17

    计算文本文件中的特定单词-Java

  18. 18

    使用awk计算文本中特定单词的实例

  19. 19

    用python计算rdd中的特定单词

  20. 20

    计算php字符串中特定单词的数量

  21. 21

    使用REGEX获取句子中不包含特定单词的特定字符串?

  22. 22

    如何使用批处理脚本从特定句子中过滤特定单词?

  23. 23

    如何从文本文件中的句子中删除特定单词?

  24. 24

    如何在RPGLE中找到句子中特定单词的起始位置

  25. 25

    如何从SQL数据库中的句子中提取特定单词?

  26. 26

    从文本文件中打印以特定单词或字符开头和结尾的句子?

  27. 27

    如果标题有特定单词,则句子中的 preg_match 字符串

  28. 28

    如何在阅读C中的特定单词后阅读整个句子

  29. 29

    从句子中删除选定单词以外的单词

热门标签

归档