什么是CoNLL数据格式？

swapna sourav rout 发表于 Dev

SWAPNA SOURAV ROUT

我是文字挖掘的新手。我使用的是开放源代码jar（Mate Parser），它在依赖项解析后以CoNLL 2009格式提供输出。我想将依赖项解析结果用于信息提取。但是我能够理解一些输出，但是不能理解CoNLL数据格式。谁能帮助我理解CoNLL数据格式？任何类型的指针将不胜感激。

dmcc

由于CoNLL每年是一个不同的共享任务，因此有许多不同的CoNLL格式。2009年CoNLL的格式描述在这里。每行代表一个单词，带有一系列制表符分隔的字段。_s表示空值。Mate-Parser的手册说，它使用了CoNLL 2009的前12列：

ID FORM LEMMA PLEMMA POS PPOS FEAT PFEAT HEAD PHEAD DEPREL PDEPREL

其中一些列的定义来自早期的共享任务（2006和2007年使用的CoNLL-X格式）：

ID （句子索引，从1开始）
FORM （单词形式本身）
LEMMA （单词的引理或词干）
POS （词性）
FEAT （用|分隔的形态特征列表）
HEAD（语法父级的索引，0为ROOT）
DEPREL（HEAD与该词之间的句法关系）

这些列的变体（例如PPOS但不是POS）以开头，P表示该值是自动预测的，而不是黄金标准值。

更新：现在还有一种CoNLL-U数据格式，并且扩展了CoNLL-X格式。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2020-11-26

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

什么是CoNLL数据格式？

什么是CoNLL数据格式？

AVFrame数据格式

数据格式对比

那是什么样的数据格式？

JCAMP-DX数据格式是什么？

AdWords API TargetingIdeaPage服务返回的数据格式是什么？

Keras：递归网络的正确数据格式是什么？

R中大文件的数据格式是什么？

AWS Sagemaker：传递给Estimator的数据格式是什么？

Google Analytics UserID 的推荐数据格式是什么？

axios发布数据格式

长数据格式的时差

数据格式和跨度

Compression Plus数据格式？

数据格式转换Python

解释Cayley数据格式

TK 103数据格式

PHP JSON数据格式

json数据格式错误

JSON数据格式错误

axios发布数据格式

矩阵格式的RDLC数据格式

SAS数据格式转int格式

在IBM-Watson云产品中输入所需的数据格式是什么？

必须馈送到freetds工具bsqldb的数据格式是什么？

为什么QTest不允许const char *作为测试数据格式？

使用敏感数据格式化（LUKS）加密分区后会发生什么？

那是什么数据格式，我如何通过 PHP 读取它？

在 hadoop hdfs 中查看数据格式的最佳方法是什么？

主干获取url数据格式错误