查看文本中找到的7个最常见的单词，但对属于常见单词的单词进行排序

debugcn 发表于 Dev

奥利弗·伯格曼（Oliver Bergman）

确实需要一些帮助来解决此问题，或者如果有人可以用正确的方式指出我，谢谢！

查看文本中找到的7个最常见的单词，但对作为常见单词的单词进行排序。您可以在common-words.txt中找到常见单词的列表。

common-words.txt =许多不同的单词。

首先，我在文本中找到了7个最常用的词，这就是我的代码的样子。

    print("The 7 most frequently used words is:")
    print("\n")

    import re
    from collections import Counter

    with open("alice-ch1.txt") as f:
        passage = f.read()

    words = re.findall(r'\w+', passage)

    cap_words = [word.upper() for word in words]

    word_counts = Counter(cap_words).most_common(7)

    print(word_counts)

这有效，我得到了输出：

[('THE', 93), ('SHE', 80), ('TO', 75), ('IT', 67), ('AND', 65), ('WAS', 53), ('A', 52)]

现在，我想比较这两个文本文件，如果我的TEXTFILE.TXT中的任何单词在COMMON-WORDS.TXT中，我希望将其从答案中删除。

我试图用以下代码运行它：

    dic_no_cw = dict(word_counts)
    with open("common-words.txt", 'r') as cw:
        commonwords = list(cw.read().split())
        for key, value in list(dic_no_cw.items()):
            for line in commonwords:
                if key == line:
                    del dic_no_cw[key]

    dict_copy = dict(dic_no_cw)

    dic_no_cw7 = Counter(dic_no_cw).most_common(7)
    sorted(dic_no_cw7)

    print(dic_no_cw7)

和我得到相同的输出：

[('THE', 93), ('SHE', 80), ('TO', 75), ('IT', 67), ('AND', 65), ('WAS', 53), ('A', 52)]

可以真的使用som帮助来解决此问题或一些帮助，以便我自己解决。

谢谢，

苏尼尔·索拉特

您是否可以尝试替换以下代码行：

for line in commonwords:
    if key == line:
        del dic_no_cw[key]

和

for line in commonwords:
    if key.strip() == line.upper().strip():
        del dic_no_cw[key]
        break

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-2

我来说两句

0条评论

登录后参与评论

来自分类Dev

如何获得给定文本中N个最常见的单词（从最大到最小排序）？

来自分类Dev

使用LINQ查找最常见的单词

来自分类Dev

txt文件中最常见的单词

来自分类Dev

Java ArrayList中最常见的n个单词

来自分类Dev

每行计算前10个最常见的单词

来自分类Dev

如何在给定的文本中获得N个最常见的单词，从最大到最小排序？

来自分类Dev

找到最常见的连续两个单词序列awk

来自分类Dev

如何在不排序的情况下获得前k个最常见的单词？

来自分类Dev

如何在不排序的情况下获得前k个最常见的单词？

来自分类Dev

如何在.csv文件中找到最常见的单词，而忽略每一行的重复项？

来自分类Dev

字符串中最常见的单词

来自分类Dev

查找字符串中最常见的单词

来自分类Dev

范围中最常见的单词，忽略空格

来自分类Dev

在Python 3中查找网站中最常见的单词

来自分类Dev

无空格字符串中最常见的单词

来自分类Dev

在Python 3中查找网站中最常见的单词

来自分类Dev

使用hashmaps查找最常见的单词C ++

来自分类Dev

文本分析：使用python查找列中最常见的单词

来自分类Dev

在R中找到最常见的路径

来自分类Dev

计算Dataframe Pandas中句子中最常见的100个单词

来自分类Dev

使用Java从文件中查找“ n”个最常见的单词？

来自分类Dev

在文件中查找N个最常见的单词以及如何处理连字符？

来自分类Dev

打印两个文本文件中常见的单词

来自分类Dev

尝试在列表中标出前25个最常见的单词，并获得多余的撇号和逗号

来自分类Dev

在理货/分类帐系统中查找最常见的单词

来自分类Dev

计算带有排除项的SQL表中最常见的单词

来自分类Dev

改进Java 8查找“战争与和平”中最常见单词的方式

来自分类Dev

在bash中找到文件中最常见的行

来自分类Dev

如何在多个栏中找到最常见的值？

Related 相关文章

文章