遍历元组,获取下一个项目

Natalien

我在获取元组中的项目时遇到了一些困难的问题。我有一个元组列表,它看起来像这样(包含一个单词和一个标签):

[('An', 'DET'),
 ('autumn', 'NOUN'),
 ('evening', 'NOUN'),
 ('.', '.'),
 ('In', 'ADP'),
 ('an', 'DET'),
 ('old', 'ADJ'),
 ('woodshed', 'NOUN'),
 ('The', 'DET'),
 ('long', 'ADJ'),
 ('points', 'NOUN'),
 ('of', 'ADP'),
 ('icicles', 'NOUN'),
 ('Are', 'NOUN'),
 ('sharpening', 'VERB'),
 ('the', 'DET'),
 ('wind', 'NOUN'),
 ('.', '.')....]

我想做的是遍历这些元组,并确定下一个单词标签基于前一个单词标签的可能性。例如,如果我想确定“ DET”出现在“ NOUN”前面的次数,我想遍历元组并确定,例如:

“名词”前面出现“ DET”的次数

到目前为止,我已经尝试过了:

prob = 0.0
for item in tuples:
   if item[1] == "DET" and item + 1[1] == "NOUN"
return prob

if说法显然是不正确的。有人知道我可以做什么才能访问下一个项目吗?

雷蒙德·海廷格(Raymond Hettinger)

将单词成对组合的最简单方法是使用itertools模块zip(seq, seq[1:])配方部分中所示的方法

收集计数最简单的方法是使用collections.Counter()

将它们放在一起看起来像这样:

>>> from collections import Counter

>>> Counter((f, s) for (_, f), (_, s) in zip(tuples, tuples[1:]))
Counter({('ADJ', 'NOUN'): 2, ('NOUN', 'ADP'): 2, ('NOUN', 'NOUN'): 2,
         ('DET', 'NOUN'): 2, ('DET', 'ADJ'): 2, ('ADP', 'NOUN'): 1,
         ('NOUN', 'VERB'): 1, ('NOUN', 'DET'): 1, ('VERB', 'DET'): 1,
         ('ADP', 'DET'): 1})

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

在硒中获取下一个元素

来自分类Dev

从序列SQL获取下一个值

来自分类Dev

JSoup解析:获取下一个元素

来自分类Dev

在JDBC中获取下一个ResultSet

来自分类Dev

Ansible循环获取下一个值

来自分类Dev

Impala查询以获取下一个日期

来自分类Dev

XSL从节点获取下一个值

来自分类Dev

获取下一个max(id)

来自分类Dev

从EditText获取下一个事件

来自分类Dev

获取下一个号码MS Access

来自分类Dev

AngularJS获取下一个状态

来自分类Dev

获取下一个DOM元素的ID

来自分类Dev

从数组获取下一个int

来自分类Dev

获取下一个数组元素

来自分类Dev

获取下一个元素文本

来自分类Dev

使用 xpath 获取下一个元素

来自分类Dev

如何在单击按钮时从微调器中获取下一个/上一个项目?

来自分类Dev

如何遍历HTML节点以找到匹配项并从节点获取下一个innerHTML

来自分类Dev

在Queryable上获取下一个和上一个

来自分类Dev

REGEX获取下一个上一个单词

来自分类Dev

获取下一个和上一个CakePHP 2的Paginator的URL

来自分类Dev

Java获取下一个Enum值或从第一个开始

来自分类Dev

RESTful URI以获取下一个/上一个资源

来自分类Dev

获取下一个和上一个对象的JSON

来自分类Dev

学说-获取下一个和上一个记录

来自分类Dev

获取下一个和上一个对象的JSON

来自分类Dev

根据视图获取下一个和上一个MySQL ID

来自分类Dev

获取下一个和上一个CakePHP 2的Paginator的URL

来自分类Dev

使用BeautifulSoup遍历XML并提取下一个同级对象