如何将函数(BigramCollocationFinder)应用于Pandas DataFrame

你好

我不太习惯编程,需要一些帮助来解决问题。我有一个.csv,带有4列和大约5k行,充满了问题和答案。我想在每个单元格中找到单词搭配。

起点:具有4列和约5k行的Pandas数据框。(编号,标题,正文,正文2)

目标:具有7列(Id,标题,标题合并,Body,Body_Collocations,Body2,Body2-Collocations)的数据框,并对每个行应用一个函数。

我在NLTK文档中找到了Bigramm配置的示例。

bigram_measures = nltk.collocations.BigramAssocMeasures()
finder.apply_freq_filter(3)
finder = BigramCollocationFinder.from_words(nltk.corpus.genesis.words('english-web.txt'))
print (finder.nbest(bigram_measures.pmi, 5))
>>>[('Beer', 'Lahai'), ('Lahai', 'Roi'), ('gray', 'hairs'), ('Most', 'High'), ('ewe', 'lambs')]

我想使此功能适应我的Pandas Dataframe。我知道Pandas Dataframes的apply函数,但是无法使其正常工作。

这是我对其中一列的测试方法:

df['Body-Collocation'] = df.apply(lambda df: BigramCollocationFinder.from_words(df['Body']),axis=1)

但是如果我打印出示例行我得到

print (df['Body-Collocation'][1])
>>> <nltk.collocations.BigramCollocationFinder object at 0x113c47ef0>

我什至不确定这是否正确。有人可以指出我正确的方向吗?

斯特凡

如果要应用BigramCollocationFinder.from_words()到每个valueBody`列,你必须做的:

df['Body-Collocation'] = df.Body.apply(lambda x: BigramCollocationFinder.from_words(x))

在本质上,apply允许你遍历rows并提供相应valueBody column所施加的功能。

但是,正如评论中所建议的那样,提供数据样本将使解决您的特定案例变得更加容易。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何将类内的函数应用于pandas Dataframe

来自分类Dev

如何将我的函数应用于 DataFrame 列?

来自分类Dev

如何将groupBy和聚合函数应用于PySpark DataFrame中的特定窗口?

来自分类Dev

如何将Window函数应用于DataFrame中的多列

来自分类Dev

将解析函数应用于Pandas DataFrame

来自分类Dev

pandas DataFrame,如何将功能应用于特定列?

来自分类Dev

pandas – 将函数逐行应用于 DataFrame,从而产生不同维度的新 DataFrame

来自分类Dev

将函数应用于pandas DataFrame会导致值错误(仅一个参数)

来自分类Dev

将迭代函数应用于pandas DataFrame中的每个组

来自分类Dev

将迭代函数应用于pandas DataFrame中的每个组

来自分类Dev

在 Pandas 中多线程地将函数应用于 DataFrame 中的每个单元格

来自分类Dev

将函数应用于DataFrame并创建新列

来自分类Dev

Pyspark-如何仅将函数应用于DataFrame中列的子集?

来自分类Dev

将置换矩阵应用于pandas DataFrame

来自分类Dev

将for循环应用于Pandas中的多个DataFrame

来自分类Dev

如何使用to_html将CSS类(我的样式)应用于Pandas DataFrame

来自分类Dev

将SequenceMatcher应用于DataFrame

来自分类Dev

将自定义聚合函数应用于pandas DataFrame

来自分类Dev

将函数应用于两个DataFrame列并从结果中创建新列

来自分类Dev

将(行)函数应用于DataFrame会更改列类型

来自分类Dev

使用其列作为参数将函数应用于DataFrame

来自分类Dev

将lambda与命名函数应用于熊猫DataFrame之间的性能差异

来自分类Dev

将函数应用于DataFrame中特定数量的行

来自分类Dev

将函数应用于具有多处理功能的 DataFrame 时设置新列名

来自分类Dev

Julia:将函数应用于 DataFrame 中的每个单元格(不丢失列名)

来自分类Dev

使用计数将条件排除应用于Pandas DataFrame

来自分类Dev

Pandas DataFrame将功能应用于多列并输出多列

来自分类Dev

Pandas DataFrame将功能应用于多列并输出多列

来自分类Dev

使用计数将条件排除应用于Pandas DataFrame

Related 相关文章

  1. 1

    如何将类内的函数应用于pandas Dataframe

  2. 2

    如何将我的函数应用于 DataFrame 列?

  3. 3

    如何将groupBy和聚合函数应用于PySpark DataFrame中的特定窗口?

  4. 4

    如何将Window函数应用于DataFrame中的多列

  5. 5

    将解析函数应用于Pandas DataFrame

  6. 6

    pandas DataFrame,如何将功能应用于特定列?

  7. 7

    pandas – 将函数逐行应用于 DataFrame,从而产生不同维度的新 DataFrame

  8. 8

    将函数应用于pandas DataFrame会导致值错误(仅一个参数)

  9. 9

    将迭代函数应用于pandas DataFrame中的每个组

  10. 10

    将迭代函数应用于pandas DataFrame中的每个组

  11. 11

    在 Pandas 中多线程地将函数应用于 DataFrame 中的每个单元格

  12. 12

    将函数应用于DataFrame并创建新列

  13. 13

    Pyspark-如何仅将函数应用于DataFrame中列的子集?

  14. 14

    将置换矩阵应用于pandas DataFrame

  15. 15

    将for循环应用于Pandas中的多个DataFrame

  16. 16

    如何使用to_html将CSS类(我的样式)应用于Pandas DataFrame

  17. 17

    将SequenceMatcher应用于DataFrame

  18. 18

    将自定义聚合函数应用于pandas DataFrame

  19. 19

    将函数应用于两个DataFrame列并从结果中创建新列

  20. 20

    将(行)函数应用于DataFrame会更改列类型

  21. 21

    使用其列作为参数将函数应用于DataFrame

  22. 22

    将lambda与命名函数应用于熊猫DataFrame之间的性能差异

  23. 23

    将函数应用于DataFrame中特定数量的行

  24. 24

    将函数应用于具有多处理功能的 DataFrame 时设置新列名

  25. 25

    Julia:将函数应用于 DataFrame 中的每个单元格(不丢失列名)

  26. 26

    使用计数将条件排除应用于Pandas DataFrame

  27. 27

    Pandas DataFrame将功能应用于多列并输出多列

  28. 28

    Pandas DataFrame将功能应用于多列并输出多列

  29. 29

    使用计数将条件排除应用于Pandas DataFrame

热门标签

归档