如何在Ruby中分析文本?

B七

寻找一种分析文本某些特征的方法,例如:

  1. 识别首字母缩写词和标题(ICANN,博士博士等)
  2. 行话
  3. 阅读水平
  4. 副词和形容词
  5. 正确的语法和标点符号
  6. 主动和被动的声音

我看了斯坦福大学NLP库,但不知道他们在说什么(可能是因为我没有语言学学位)。

是否有一个Ruby gem可以提供这种文本分析?

diasks2

1.)对于缩写,您可以从这里窃取:https : //github.com/diasks2/pragmatic_segmenter/blob/master/lib/pragmatic_segmenter/abbreviation.rb至于首字母缩写词,列表可能是无止境的,所以它实际上取决于您要尝试执行的操作。您可以尝试使用正则表达式来提取首字母缩写词。

2)不确定,您将必须更加详细地说明您要完成的工作。

3.)使用lingua gem并查看本教程

4.)engtagger,这是一个Ruby Part-Of-Speech Tagger库。

5.)我不知道有哪个库可以自动检测正确的语法/标点错误(因为在很多情况下,没有明确的正确答案)。但是,我确实制作了一个宝石,人类可以在其中纠正一个句子,并且该宝石会自动显示不正确的句子与正确的句子之间的差异,包括错误的数量,错误的类型等。这称为“聊天正确”

6.)检查出称为动词的宝石

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何在Ruby中分析文本?

来自分类Dev

如何在R中分析时间

来自分类Dev

如何在Haskell中分析功能?

来自分类Dev

如何在sharedPreferences中分析ANR

来自分类Dev

如何在R中分析时间

来自分类Dev

如何在 Flask 中分析 AJAX 端点?

来自分类Dev

如何使用Java API在Elasticsearch中分析文本?

来自分类Dev

如何在Datastax(DSE)搜索中分析JSON字段

来自分类Dev

如何在IntelliJ中分析堆转储?(内存泄漏)

来自分类Dev

如何在Matlab中分析矢量外部乘积

来自分类Dev

如何在ELK中分析来自多个来源的日志

来自分类Dev

如何在Sonar中分析同一组模块

来自分类Dev

如何在if语句中分析每个向量值

来自分类Dev

如何在Xcode中分析应用程序的IPS文件?

来自分类Dev

如何在systemd-analyze中分析固件时间?

来自分类Dev

如何在 IBM SPSS 中分析拉丁方设计?

来自分类Dev

如何在 Java Mission Control 中分析异常?

来自分类Dev

如何在Jmeter中分析特定请求的答案

来自分类Dev

在ruby中分析和保存文件的问题

来自分类Dev

如何在R中给定文本中分隔单词?

来自分类Dev

scrapy,如何在HTML标记元素中分隔文本

来自分类Dev

如何在php mysqli中分别保存图像和文本

来自分类Dev

如何在Eclipse EE Luna中分析Java Web应用程序servlet调用

来自分类Dev

如何在CentOS 7中分析httpd(Apache Web服务器)日志

来自分类Dev

如何在Microsoft Azure流分析上从多个设备中分离数据

来自分类Dev

如何在测试任务中的Azure Devops管道中分析超时

来自分类Dev

如何在命令行Linux中分析磁盘使用情况?

来自分类Dev

如何在Ubuntu 16.04中分析和整理驱动器碎片

来自分类Dev

如何在Python中分析和识别有向图关系(节点之间)

Related 相关文章

热门标签

归档