如何删除数据框中的停用词(Python)

塔纳西特(Tanasit Rengsomboonsuk)

这是我的代码,它不起作用

from pythainlp.corpus import thai_stopwords    
stopwords =thai_stopwords()
    def remove_stopwords(x):
      list_token = []
      for i in x:
          if i not in stopwords:
            list_token.append(i)

   return list_token
df['tokens']=df['tokens'].apply(remove_stopwords)

我已经尝试过了

df['tokens'] = df['tokens'].apply(lambda x: [item for item in x if item not in stopwords])
2号

假设您stopwords是一个列表,并且df['tokens']每个单词或标记都是一个列表。
简单方法:

clear_tokens = []
for i in df.index:
   clear_tokens.append([item for item in df.tokens[i] if item not in stopwords])

df['tokens'] = clear_tokens

如果您df.tokens是每一行中的一个句子,则:

clear_tokens = []
for i in df.index:
   tokenlist = df.tokens[i].split()
   clear_tokens.append(' '.join([item for item in tokenlist if item not in stopwords]))

df['tokens'] = clear_tokens


本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Python从熊猫数据框中删除停用词

来自分类Dev

使用Python从数据框的列中删除停用词

来自分类Dev

从数据框中删除停用词

来自分类Dev

从R数据框列中删除停用词

来自分类Dev

Python从熊猫数据框中删除自定义停用词

来自分类Dev

如何从 Python 中的对象中删除停用词

来自分类Dev

如何从CSV文件中删除停用词

来自分类Dev

如何从CSV文件中删除停用词

来自分类Dev

在Python中删除停用词的更快方法

来自分类Dev

从熊猫数据框中删除自定义停用词不起作用

来自分类Dev

如何删除数据框中的回车

来自分类Dev

如何过滤Pandas数据框中包含的SpaCy标记化文本的停用词

来自分类Dev

删除R中的停用词

来自分类Dev

如何使用Shell脚本从句子中删除停用词?

来自分类Dev

如何从PostgreSQL的字符串列中删除我的停用词

来自分类Dev

如何从文本中删除所有停用词?

来自分类Dev

如何从句子向量中删除停用词?

来自分类Dev

从python的计数器中删除停用词列表

来自分类Dev

使用列表理解删除Python列表中的停用词

来自分类Dev

使用python3从列表中删除停用词

来自分类Dev

在Python中删除数据框中的匹配对

来自分类Dev

如何删除多种语言的停用词?

来自分类Dev

使用Python删除停用词-快速高效

来自分类Dev

Python pandas 在删除停用词时出错

来自分类Dev

从字符串中删除停用词

来自分类Dev

从列表列表中删除停用词

来自分类Dev

从句子中删除停用词

来自分类Dev

从 CSV 文件中删除停用词

来自分类Dev

如何删除数据框中的所有行?