我试图计算.csv文件中单词“ the”的出现次数,但是当我运行以下代码时,它返回0。(test.csv位于此处)
我只是搜索此文件的第一列。
import csv
import nltk
tweet = []
for t in csv.DictReader(open('test.csv'), delimiter=','):
tweet.append(t['text'])
tweet_text = nltk.Text(tweet)
print tweet_text.count("the")
在此先感谢您的帮助。
text
使用将字段拆分成单词str.split
,然后相应地使用list.extend
。除非您只需要小写,否则将小写the
。
>>> nltk.Text(['the world The words']).count('the')
0
>>> nltk.Text(['the', 'world', 'The', 'words']).count('the')
1
完整的代码:
import csv
import nltk
tweet = []
for t in csv.DictReader(open('test.csv'), delimiter=','):
tweet.extend(t['text'].lower().split()) # <-----------
tweet_text = nltk.Text(tweet)
print tweet_text.count('the')
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句