寻找一种分析文本某些特征的方法,例如:
我看了斯坦福大学NLP库,但不知道他们在说什么(可能是因为我没有语言学学位)。
是否有一个Ruby gem可以提供这种文本分析?
1.)对于缩写,您可以从这里窃取:https : //github.com/diasks2/pragmatic_segmenter/blob/master/lib/pragmatic_segmenter/abbreviation.rb。至于首字母缩写词,列表可能是无止境的,所以它实际上取决于您要尝试执行的操作。您可以尝试使用正则表达式来提取首字母缩写词。
2)不确定,您将必须更加详细地说明您要完成的工作。
4.)签出engtagger,这是一个Ruby Part-Of-Speech Tagger库。
5.)我不知道有哪个库可以自动检测正确的语法/标点错误(因为在很多情况下,没有明确的正确答案)。但是,我确实制作了一个宝石,人类可以在其中纠正一个句子,并且该宝石会自动显示不正确的句子与正确的句子之间的差异,包括错误的数量,错误的类型等。这称为“聊天正确”。
6.)检查出称为动词的宝石。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句