什么是CoNLL数据格式?

SWAPNA SOURAV ROUT

我是文字挖掘的新手。我使用的是开放源代码jar(Mate Parser),它在依赖项解析后以CoNLL 2009格式提供输出。我想将依赖项解析结果用于信息提取。但是我能够理解一些输出,但是不能理解CoNLL数据格式。谁能帮助我理解CoNLL数据格式?任何类型的指针将不胜感激。

dmcc

由于CoNLL每年是一个不同的共享任务,因此有许多不同的CoNLL格式。2009年CoNLL的格式描述在这里每行代表一个单词,带有一系列制表符分隔的字段。_s表示空值。Mate-Parser的手册说,它使用了CoNLL 2009的前12列:

ID FORM LEMMA PLEMMA POS PPOS FEAT PFEAT HEAD PHEAD DEPREL PDEPREL

其中一些列的定义来自早期的共享任务(2006和2007年使用CoNLL-X格式):

  • ID (句子索引,从1开始)
  • FORM (单词形式本身)
  • LEMMA (单词的引理或词干)
  • POS (词性)
  • FEAT (用|分隔的形态特征列表)
  • HEAD(语法父级的索引,0为ROOT
  • DEPRELHEAD与该词之间的句法关系

这些列的变体(例如PPOS但不是POS)以开头,P表示该值是自动预测的,而不是黄金标准值。

更新:现在还有一种CoNLL-U数据格式,并且扩展了CoNLL-X格式。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

AVFrame数据格式

来自分类Dev

数据格式对比

来自分类Dev

那是什么样的数据格式?

来自分类Dev

JCAMP-DX数据格式是什么?

来自分类Dev

AdWords API TargetingIdeaPage服务返回的数据格式是什么?

来自分类Dev

Keras:递归网络的正确数据格式是什么?

来自分类Dev

R中大文件的数据格式是什么?

来自分类Dev

AWS Sagemaker:传递给Estimator的数据格式是什么?

来自分类Dev

Google Analytics UserID 的推荐数据格式是什么?

来自分类Dev

axios发布数据格式

来自分类Dev

长数据格式的时差

来自分类Dev

数据格式和跨度

来自分类Dev

Compression Plus数据格式?

来自分类Dev

数据格式转换Python

来自分类Dev

解释Cayley数据格式

来自分类Dev

TK 103数据格式

来自分类Dev

PHP JSON数据格式

来自分类Dev

json数据格式错误

来自分类Dev

JSON数据格式错误

来自分类Dev

axios发布数据格式

来自分类Dev

矩阵格式的RDLC数据格式

来自分类Dev

SAS数据格式转int格式

来自分类Dev

在IBM-Watson云产品中输入所需的数据格式是什么?

来自分类Dev

必须馈送到freetds工具bsqldb的数据格式是什么?

来自分类Dev

为什么QTest不允许const char *作为测试数据格式?

来自分类Dev

使用敏感数据格式化(LUKS)加密分区后会发生什么?

来自分类Dev

那是什么数据格式,我如何通过 PHP 读取它?

来自分类Dev

在 hadoop hdfs 中查看数据格式的最佳方法是什么?

来自分类Dev

主干获取url数据格式错误