如何使用nltk来阻止西班牙语单词列表?

约翰·杜

如何使用nltk snowballstemer阻止以下列表中的所有西班牙语单词?这是我尝试过的:

# coding=utf-8


from sklearn.feature_extraction.text import CountVectorizer
import nltk.stem

vectorizer= CountVectorizer(min_df=1)

opinion = ["""
Hola compis!
No sabÌa como se ponÌa una lavadora hasta que conocÌ
esta y es que es muy sencilla de utilizar! Todo un gustazo
cuando estamos aprendiendo para emanciparnos, que si nos
ponen facilidad con las tareas de la casa pues mejor que mejor.


Antes de esta tenÌamos otra de la marca Otsein, de estas
que van incluidas en el mobiliario y adem·s era de carga superior,
pero tan antigua que seg˙n mi madre, nadie la podÌa tocar porque
solo la entendÌa ella.
Esta es de la marca Aeg y dentro de este tipo de lavadoras de
esta marca las habÌa m·s caras o m·s baratas y est· digamos que
est· en el punto medio. Es de color blanco y tiene carga frontal,
 con una capacidad de 6kg. En casa a pesar de ser cuatro,
 se ponen lavadoras casi todos o todos los dÌas.


En su parte de arriba encontramos la ";zona de mandos";,
donde se puede echar el detergente, aunque en nuestro caso
lo al ser gel lo ponemos directamente junto con la ropa.
Luego tiene la rueda para elegir el programa y los intermitentes
que indican en que paso del programa estaba.
Como todas tiene programas m·s cortos y m·s largos, incluso
un programa que seria como lavar a mano y otro ideal para
estores, que salen casi secos y planchaditos para colgar y
ya est·. Es muy f·cil de aprenderla y adem·s tiene indicador
por sonido de cuando acaba, lista para abrir y tender.
Saludillos!
"""]

spanish_stemmer = nltk.stem.SnowballStemmer('spanish')
print "\n these are the stems of opinion",
opinion = [[spanish_stemmer(word) for word in sentence.split(" ")]for sentence in opinion]

该问题的问题是以下这是输出:

Traceback (most recent call last):
 these are the stems of opinion
  File "/Users/user/PycharmProjects/untitled/prueba stem.py", line 47, in <module>
    opinion = [[spanish_stemmer(word) for word in sentence.split(" ")]for sentence in opinion]
TypeError: 'SnowballStemmer' object is not callable

给定列表(opinion),如何返回词干列表以及如何将完整意见小写?

睡觉
>>> from nltk import word_tokenize
>>> from nltk.stem import SnowballStemmer
>>> stemmer = SnowballStemmer('spanish')
>>> 
>>> stemmer.stem('cuando')
u'cuand'
>>> stemmer.stem('apprenderla')
u'apprend'
>>> 
>>> text = 'En su parte de arriba encontramos la ";zona de mandos";, donde se puede echar el detergente, aunque en nuestro caso lo al ser gel lo ponemos directamente junto con la ropa.'
>>> stemmed_text = [stemmer.stem(i) for i in word_tokenize(text)]
>>> stemmed_text
[u'en', u'su', u'part', u'de', u'arrib', u'encontr', u'la', u'``', u';', u'zon', u'de', u'mand', u"''", u';', u',', u'dond', u'se', u'pued', u'echar', u'el', u'detergent', u',', u'aunqu', u'en', u'nuestr', u'cas', u'lo', u'al', u'ser', u'gel', u'lo', u'pon', u'direct', u'junt', u'con', u'la', u'rop', u'.']

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何使用nltk阻止西班牙语单词列表?

来自分类Dev

如何使用NLTK雪球提取器来提取西班牙语单词列表Python

来自分类Dev

NLTK缺少西班牙语单词网

来自分类Dev

如何在NLTK中使用西班牙语Wordnet?

来自分类Dev

如何用模式对西班牙语单词进行词法化?

来自分类Dev

如何用模式对西班牙语单词进行词法化?

来自分类Dev

如何从西班牙语单词中删除特殊字符

来自分类Dev

如何在西班牙语中使用 TesseractOCRiOS?

来自分类Dev

西班牙语键盘如何显示西班牙语重音字符?

来自分类Dev

如何在python中使用西班牙语进行编码和解码

来自分类Dev

如何使用SimpleDateFormat格式化句子中的西班牙语月份?

来自分类Dev

不使用桌面环境时,如何在Linux中键入德语或西班牙语字符?

来自分类Dev

如何在西班牙语中放置MultiDatesPicker?

来自分类Dev

如何在javascript中允许西班牙语字母

来自分类Dev

使用googletrans将西班牙语翻译成英语

来自分类Dev

使用Perl文件处理的CSV中的西班牙语字符

来自分类Dev

TTS无法使用的某些语言环境-包括西班牙语

来自分类Dev

在移动设备上使用input =“ date”的西班牙语日历

来自分类Dev

在 Torchtext 中使用西班牙语中的预训练嵌入

来自分类Dev

如何使用jdbc-odbc驱动程序从MS Access数据库正确返回特殊的西班牙语字符

来自分类Dev

如何在python中使用西班牙语千位分组格式化数字?

来自分类Dev

正则表达式在Perl中提取西班牙语(可能是非英语)单词

来自分类Dev

正则表达式在Perl中提取西班牙语(可能是非英语)单词

来自分类Dev

GF中的NP的西班牙语动词

来自分类Dev

angularjs搜索并忽略西班牙语字符

来自分类Dev

西班牙语的IBM Watson Alchemy服务

来自分类Dev

Rstudio 拼写检查器(西班牙语)

来自分类Dev

Ubuntu支持社区(针对讲西班牙语/西班牙语的人)?

来自分类Dev

如何在Javascript中打印罗马语言(例如西班牙语)/特殊字符?

Related 相关文章

  1. 1

    如何使用nltk阻止西班牙语单词列表?

  2. 2

    如何使用NLTK雪球提取器来提取西班牙语单词列表Python

  3. 3

    NLTK缺少西班牙语单词网

  4. 4

    如何在NLTK中使用西班牙语Wordnet?

  5. 5

    如何用模式对西班牙语单词进行词法化?

  6. 6

    如何用模式对西班牙语单词进行词法化?

  7. 7

    如何从西班牙语单词中删除特殊字符

  8. 8

    如何在西班牙语中使用 TesseractOCRiOS?

  9. 9

    西班牙语键盘如何显示西班牙语重音字符?

  10. 10

    如何在python中使用西班牙语进行编码和解码

  11. 11

    如何使用SimpleDateFormat格式化句子中的西班牙语月份?

  12. 12

    不使用桌面环境时,如何在Linux中键入德语或西班牙语字符?

  13. 13

    如何在西班牙语中放置MultiDatesPicker?

  14. 14

    如何在javascript中允许西班牙语字母

  15. 15

    使用googletrans将西班牙语翻译成英语

  16. 16

    使用Perl文件处理的CSV中的西班牙语字符

  17. 17

    TTS无法使用的某些语言环境-包括西班牙语

  18. 18

    在移动设备上使用input =“ date”的西班牙语日历

  19. 19

    在 Torchtext 中使用西班牙语中的预训练嵌入

  20. 20

    如何使用jdbc-odbc驱动程序从MS Access数据库正确返回特殊的西班牙语字符

  21. 21

    如何在python中使用西班牙语千位分组格式化数字?

  22. 22

    正则表达式在Perl中提取西班牙语(可能是非英语)单词

  23. 23

    正则表达式在Perl中提取西班牙语(可能是非英语)单词

  24. 24

    GF中的NP的西班牙语动词

  25. 25

    angularjs搜索并忽略西班牙语字符

  26. 26

    西班牙语的IBM Watson Alchemy服务

  27. 27

    Rstudio 拼写检查器(西班牙语)

  28. 28

    Ubuntu支持社区(针对讲西班牙语/西班牙语的人)?

  29. 29

    如何在Javascript中打印罗马语言(例如西班牙语)/特殊字符?

热门标签

归档