使用Python在句子列表中形成单词的二元组

假想忍者

我有一个句子列表:

text = ['cant railway station','citadel hotel',' police stn']. 

我需要形成双字母对,并将它们存储在变量中。问题是当我这样做时,我得到一对句子而不是单词。这是我所做的:

text2 = [[word for word in line.split()] for line in text]
bigrams = nltk.bigrams(text2)
print(bigrams)

产生

[(['cant', 'railway', 'station'], ['citadel', 'hotel']), (['citadel', 'hotel'], ['police', 'stn'])

火车站和城堡酒店不能合二为一。我想要的是

[([cant],[railway]),([railway],[station]),([citadel,hotel]), and so on...

第一个句子的最后一个单词不应与第二个句子的第一个单词合并。我应该怎么做才能使其正常工作?

布奇

使用列表推导zip

>>> text = ["this is a sentence", "so is this one"]
>>> bigrams = [b for l in text for b in zip(l.split(" ")[:-1], l.split(" ")[1:])]
>>> print(bigrams)
[('this', 'is'), ('is', 'a'), ('a', 'sentence'), ('so', 'is'), ('is', 'this'), ('this',     
'one')]

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何从对象列表中删除二元组?

来自分类Dev

从列表和字典生成二元组

来自分类Dev

Cogrouped 第二元组 CompactBuffer 中的迭代

来自分类Dev

使用二元组创建共现矩阵

来自分类Dev

遍历python中列表的二元列表

来自分类Dev

根据Scala和Spark中的频率替换二元组

来自分类Dev

如何将 countvectorizer 应用于 Pandas 数据帧中的二元组

来自分类Dev

用NLTK生成二元组

来自分类Dev

绘制与二元组相关的频率

来自分类Dev

匹配任何二元组的模式

来自分类Dev

Python 将二元素元组列表映射到 key:value 字典

来自分类Dev

从二元概率计算三元组概率

来自分类Dev

在Python中使用空格字符将句子分成单词

来自分类Dev

解析列中的行以列出excel中的每个字母,二元组和三字母组

来自分类Dev

连续重复二元组的正则表达式

来自分类Dev

从保存在2D列表中的三元组单词构造文本

来自分类Dev

从列表中生成2×2元组并在python中查找重复的元组

来自分类Dev

如何删除三元组列表中每个元组的第二个元素?

来自分类Dev

标记句子列表中的单词Python

来自分类Dev

标记句子列表中的单词Python

来自分类Dev

二元搜索+线性搜索可找到多个匹配项。如何返回结果的元组?(Python)

来自分类Dev

在Python中求和2元组

来自分类Dev

在python中求和2元组

来自分类Dev

将矢量化计数为一个文档的二元组,然后取平均值

来自分类Dev

Python:'int'对象在2元组列表中不可迭代

来自分类Dev

Python 2元组/使用星标将列表解包引发SyntaxError

来自分类Dev

使用无限性列表在Haskell中的勾股三元组

来自分类Dev

使用Python在句子中反转单词?

来自分类Dev

使用Python来反转句子中的单词

Related 相关文章

热门标签

归档