我们在python中预处理文本后如何删除空值

特里亚·索维·卡尔蒂卡萨里

例如,我有一条推文“@cintya @groot @smanela https://blog ...”,我做了一个预处理过程,链接和提及已被删除,我认为它应该丢失。但在 CSV 中,它们返回一个空值。我该如何修复它们?这是我的代码

def replaceMultiple(mainString, toBeReplaces, newString):
    for elem in toBeReplaces :
        if elem in mainString :
            mainString = mainString.replace(elem, newString)
    return  mainString

with open('datalatihNegatif.csv', encoding='utf-8') as csvfile:
    readCSV = csv.reader(csvfile, delimiter=',')
    for row in readCSV:
        _word = []
        username = row[0]
        date = row[1]
        text = row[2].lower()
        text = re.sub(r'@[A-Za-z0-9_]+','',text)
        text = re.sub(r'http\S+', '',text)

        text = replaceMultiple(text, ["!","@","#","$","%","^","&","*","(",
                                      ")","_","-","+","=","{","}","[","]",
                                      "\\","/",",",".","?","<",">",":",";",
                                      "'",'"',"~","0","1","2","3","4","5","6","7","8","9"], '')
        text = text.strip()
        nltk_tokens = nltk.word_tokenize(text)
        stop_words = set(stopwords.words("indonesian"))
        stop_words_new = ['i','liked','video','an','at','ba','da','do','ka','ma','ta','uh','yg','al','eh','ha','ah','ng']
        new_stopwords_list = stop_words.union(stop_words_new)

        print(username)
        print(date)

        for word in nltk_tokens:
            if word not in new_stopwords_list:
                if stemmer.stem(word) != "":
                    _word.append(stemmer.stem(word))
        print(_word)
        csvFile = open('preprocessingDLNegatif.csv', 'a', newline='')
        csvWriter = csv.writer(csvFile)
        csvWriter.writerow(_word)
        csvFile.close()

我希望 CSV 中的结果被删除,但实际输出是空值 CSV 481 中的1 行是空值,我该如何删除它?

沃尔沃特

_word写出任何东西之前检查一下如何

if len(_word) != 0:
    csvFile = open('preprocessingDLNegatif.csv', 'a', newline='')
    csvWriter = csv.writer(csvFile)
    csvWriter.writerow(_word)
    csvFile.close()

我也不会为你写的每条记录打开关闭输出文件。在循环之前打开它一次,完成后关闭它。这样做会使我的答案看起来像:

if len(_word) != 0:
    csvWriter.writerow(_word)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

我们究竟应何时在文本预处理管道中执行拼写校正?

来自分类Dev

我们如何解释这种复杂的C ++预处理程序宏替换

来自分类Dev

如果使用#define预处理程序,我们如何使用嵌套的if

来自分类Dev

我们如何从python 3的字符串中删除所有表情符号值?

来自分类常见问题

我们应该如何管理jdk8流中的空值

来自分类Dev

如果我们更改 UITextField 中的文本,如何更新 UIStepper 值?

来自分类Dev

我们如何从对象数组中删除重复的子值

来自分类Dev

我们如何处理vuejs中的响应?

来自分类Dev

我们如何在php中处理动态表单

来自分类Dev

我们如何才能在替换时间之前在 C 宏/预处理器中完成数学运算,而不只是替换它?

来自分类Dev

我们如何从数组中过滤文本

来自分类Dev

我们如何从“ HttpServletRequest”中删除“ Authorization”标题

来自分类Dev

我们如何在Dart中删除对象?

来自分类Dev

我们如何删除某些目录文件中的文件?

来自分类Dev

我们如何从Redis中删除表项?

来自分类Dev

我们如何从字符串中删除':'字符?

来自分类Dev

我们如何从帖子内容中删除 adSense 广告

来自分类Dev

我们如何匹配子字符串和python中dict中的值

来自分类Dev

为什么在预处理图像数据时,我们需要做零中心数据?

来自分类Dev

我们如何在Swift中评估bool值?

来自分类Dev

我们如何在NSMutableDictionary中存储浮动值

来自分类Dev

我们如何在python的其他变量中存储某个变量的先前值?

来自分类Dev

我们如何从QPushButton删除图标?

来自分类Dev

我们如何在 groovy 中捕获 ManualStepTest Description 和 Expected Result 文本框值

来自分类Dev

我们如何根据传递的值删除双向链表中的节点,它可以是任何节点?

来自分类Dev

我们如何从Google表格读取Python中的DF?

来自分类Dev

我们到底如何在Python中利用“ continue”?

来自分类Dev

我们如何获得跨度值

来自分类Dev

如果我们从 segue 获取数据,如何在填写文本字段后启用按钮

Related 相关文章

  1. 1

    我们究竟应何时在文本预处理管道中执行拼写校正?

  2. 2

    我们如何解释这种复杂的C ++预处理程序宏替换

  3. 3

    如果使用#define预处理程序,我们如何使用嵌套的if

  4. 4

    我们如何从python 3的字符串中删除所有表情符号值?

  5. 5

    我们应该如何管理jdk8流中的空值

  6. 6

    如果我们更改 UITextField 中的文本,如何更新 UIStepper 值?

  7. 7

    我们如何从对象数组中删除重复的子值

  8. 8

    我们如何处理vuejs中的响应?

  9. 9

    我们如何在php中处理动态表单

  10. 10

    我们如何才能在替换时间之前在 C 宏/预处理器中完成数学运算,而不只是替换它?

  11. 11

    我们如何从数组中过滤文本

  12. 12

    我们如何从“ HttpServletRequest”中删除“ Authorization”标题

  13. 13

    我们如何在Dart中删除对象?

  14. 14

    我们如何删除某些目录文件中的文件?

  15. 15

    我们如何从Redis中删除表项?

  16. 16

    我们如何从字符串中删除':'字符?

  17. 17

    我们如何从帖子内容中删除 adSense 广告

  18. 18

    我们如何匹配子字符串和python中dict中的值

  19. 19

    为什么在预处理图像数据时,我们需要做零中心数据?

  20. 20

    我们如何在Swift中评估bool值?

  21. 21

    我们如何在NSMutableDictionary中存储浮动值

  22. 22

    我们如何在python的其他变量中存储某个变量的先前值?

  23. 23

    我们如何从QPushButton删除图标?

  24. 24

    我们如何在 groovy 中捕获 ManualStepTest Description 和 Expected Result 文本框值

  25. 25

    我们如何根据传递的值删除双向链表中的节点,它可以是任何节点?

  26. 26

    我们如何从Google表格读取Python中的DF?

  27. 27

    我们到底如何在Python中利用“ continue”?

  28. 28

    我们如何获得跨度值

  29. 29

    如果我们从 segue 获取数据,如何在填写文本字段后启用按钮

热门标签

归档