在数据帧的每一行上应用 SentimentIntensityAnalyzer 函数并提供情绪分数

debugcn 发表于 Dev

哨兵1282

我在 Python 中编写了一个SentimentIntensityAnalyzer从nltk.sentiment.vader库中调用函数的小程序。我想分析 c2 列中提到的评论并在新的相邻列中提供情绪分数。有 10,000 条评论，我的评论已remarks.txt存档。我创建了get_sentiment()函数，但面临将数据框的每一行作为参数传递并使用 for 循环调用它以提供情绪分数并将其存储在相邻列中的问题。

我试过这些代码：

df['add'] = df.apply(lambda row: get_sentiment(row))

无法在互联网上的任何地方找到解决方案。代码如下：

import nltk
import pandas as pd
import re
from nltk.sentiment.vader import SentimentIntensityAnalyzer
remarks = pd.read_csv('/Users/ZKDN0YU/Desktop/comments/Comments.txt', 
sep='\t')
remarks.head(50)
df = pd.DataFrame(remarks)
print(df)
def get_sentiment(remarks):
 sentiment_score = sid.polarity_scores(row)
 positive_meter = round((sentiment_score['pos'] * 10), 2)
 negative_meter = round((sentiment_score['neg'] * 10), 2)
 return positive_meter, negative_meter

for index, row in df.iterrows():
 df['add'] = df.apply(lambda row: get_sentiment(row)) 
 print(row['c1'], row['c2'],"Positive",positive_meter,"Negative", 
 negative_meter)

运行上述代码时出现以下错误：

File "<ipython-input-9-7223b4fb6bd7>", line 10, in get_sentiment
 sentiment_score = sid.polarity_scores(row)

NameError: ("name 'sid' is not defined", 'occurred at index c1')

哈坎·斯文森

尝试更换

for index, row in df.iterrows():
    df['add'] = df.apply(lambda row: get_sentiment(row)) 
    print(row['c1'], row['c2'],"Positive",positive_meter,"Negative", 
    negative_meter)

和

df['positive'] = df.c2.apply(get_sentiment, k='positive')
df['negative'] = df.c2.apply(get_sentiment, k='negative')

for index, row in df.iterrows(): 
   print("Positive : {}, Negative : {}".format(row['positive'], row['negative']))

在这里，我们将函数应用于数据帧 c2 列中的所有值，并将序列返回到数据帧中的新列“add”。

get_sentiment 函数也需要使用此解决方案进行更新：

def get_sentiment(row, **kwargs):
 # Your previous code 
   return positive_meter if kwargs['k'] == 'positive' else negative_meter

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-29

我来说两句

0条评论

登录后参与评论

来自分类Dev

在 Pandas 数据帧的每一行上应用函数

来自分类Dev

在数据帧的每一行上应用函数并同时增加一个计数器

来自分类Dev

如何在数据框的每一行上应用函数？

来自分类Dev

R - 将函数应用于数据帧的每一行，函数的参数是来自每一行的值

来自分类Dev

在 Pandas 数据帧上使用转换函数，为数据帧的每一行返回新值

来自分类Dev

将自定义函数应用于R中数据帧中每一行的两列

来自分类Dev

在 numpy 数组中的每一行上应用函数？

来自分类Dev

如何在数据帧的每一行上应用功能？

来自分类Dev

在数据帧中的每3列（cols：1-3，4-6，7-9）上应用一个函数

来自分类Dev

为R数据帧中的每一行绘制一个函数

来自分类Dev

R：按因子将函数应用于数据帧的每一行，在函数中调用一个值（按因子）

来自分类Dev

R：按因子将函数应用于数据帧的每一行，在函数中调用一个值（按因子）

来自分类Dev

在数组、函数内的每一行上打开和关闭 php 标签

来自分类Dev

用户定义的函数输入可循环数据帧的每一行

来自分类Dev

Python - 遍历熊猫数据帧中每一行的函数

来自分类Dev

如何将pv.uneven（FinCal库）（或任何带有向量作为输入的函数）应用于数据帧的每一行？

来自分类Dev

如何在数据的每一列上应用函数？

来自分类Dev

R 函数从前一行中识别唯一的行，而不是完全在数据帧内

来自分类Dev

使用 optim() 在数据帧列表上应用函数

来自分类Dev

在数据帧上应用过滤器函数

来自分类Dev

在矩阵的每一行上应用函数的最快方法是什么？

来自分类Dev

在Pandas Python的每一行中应用函数时发生数据转换错误

来自分类Dev

Pandas_udf 问题：将函数应用于数据为 ArrayType 的每一行

来自分类Dev

在数据框的每一行上调用自定义函数，每行具有多个参数

来自分类Dev

使用R中的Apply系列将2列数据帧的每一行传递给我创建的函数？

来自分类Dev

如何在Python数据框中的每一行上使用split函数？

来自分类Dev

将函数应用于ndarray的每一行

来自分类Dev

将函数应用于ndarray的每一行

来自分类Dev

使用矩阵每一行中的元素应用函数

Related 相关文章

文章