如何将函数（BigramCollocationFinder）应用于Pandas DataFrame

slm 发表于 Dev

你好

我不太习惯编程，需要一些帮助来解决问题。我有一个.csv，带有4列和大约5k行，充满了问题和答案。我想在每个单元格中找到单词搭配。

起点：具有4列和约5k行的Pandas数据框。（编号，标题，正文，正文2）

目标：具有7列（Id，标题，标题合并，Body，Body_Collocations，Body2，Body2-Collocations）的数据框，并对每个行应用一个函数。

我在NLTK文档中找到了Bigramm配置的示例。

bigram_measures = nltk.collocations.BigramAssocMeasures()
finder.apply_freq_filter(3)
finder = BigramCollocationFinder.from_words(nltk.corpus.genesis.words('english-web.txt'))
print (finder.nbest(bigram_measures.pmi, 5))
>>>[('Beer', 'Lahai'), ('Lahai', 'Roi'), ('gray', 'hairs'), ('Most', 'High'), ('ewe', 'lambs')]

我想使此功能适应我的Pandas Dataframe。我知道Pandas Dataframes的apply函数，但是无法使其正常工作。

这是我对其中一列的测试方法：

df['Body-Collocation'] = df.apply(lambda df: BigramCollocationFinder.from_words(df['Body']),axis=1)

但是如果我打印出示例行我得到

print (df['Body-Collocation'][1])
>>> <nltk.collocations.BigramCollocationFinder object at 0x113c47ef0>

我什至不确定这是否正确。有人可以指出我正确的方向吗？

斯特凡

如果要应用BigramCollocationFinder.from_words()到每个value在Body`列，你必须做的：

df['Body-Collocation'] = df.Body.apply(lambda x: BigramCollocationFinder.from_words(x))

在本质上，apply允许你遍历rows并提供相应value的Body column所施加的功能。

但是，正如评论中所建议的那样，提供数据样本将使解决您的特定案例变得更加容易。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-24

我来说两句

0条评论

登录后参与评论

上一篇：Codeigniter-database.php在线服务器的主机名是什么？

来自分类Dev

将SequenceMatcher应用于DataFrame

来自分类Dev

使用计数将条件排除应用于Pandas DataFrame

来自分类Dev

将函数应用于pandas DataFrame会导致值错误（仅一个参数）

来自分类Dev

将置换矩阵应用于pandas DataFrame

来自分类Dev

pandas DataFrame，如何将功能应用于特定列？

来自分类Dev

将函数应用于两个DataFrame列并从结果中创建新列

来自分类Dev

将for循环应用于Pandas中的多个DataFrame

来自分类Dev

将迭代函数应用于pandas DataFrame中的每个组

来自分类Dev

Pandas DataFrame将功能应用于多列并输出多列

来自分类Dev

Pandas DataFrame将功能应用于多列并输出多列

来自分类Dev

将（行）函数应用于DataFrame会更改列类型

来自分类Dev

如何使用to_html将CSS类（我的样式）应用于Pandas DataFrame

来自分类Dev

将解析函数应用于Pandas DataFrame

来自分类Dev

如何将类内的函数应用于pandas Dataframe

来自分类Dev

Pyspark-如何仅将函数应用于DataFrame中列的子集？

来自分类Dev

将函数应用于DataFrame并创建新列

来自分类Dev

将自定义聚合函数应用于pandas DataFrame

来自分类Dev

使用其列作为参数将函数应用于DataFrame

来自分类Dev

如何将groupBy和聚合函数应用于PySpark DataFrame中的特定窗口？

来自分类Dev

将lambda与命名函数应用于熊猫DataFrame之间的性能差异

来自分类Dev

将函数应用于DataFrame中特定数量的行

来自分类Dev

使用计数将条件排除应用于Pandas DataFrame

来自分类Dev

将迭代函数应用于pandas DataFrame中的每个组

来自分类Dev

在 Pandas 中多线程地将函数应用于 DataFrame 中的每个单元格

来自分类Dev

将函数应用于具有多处理功能的 DataFrame 时设置新列名

来自分类Dev

如何将Window函数应用于DataFrame中的多列

来自分类Dev

pandas – 将函数逐行应用于 DataFrame，从而产生不同维度的新 DataFrame

来自分类Dev

如何将我的函数应用于 DataFrame 列？

来自分类Dev

Julia：将函数应用于 DataFrame 中的每个单元格（不丢失列名）

Related 相关文章

文章