我需要为我自己,我的Twitter关注者及其关注者创建一个documenttermmatrix。
我们需要在不使用tm包的情况下创建它。
目前,我们有以下变量:
列表l:包含所有关注者的关注者,按关注者存储(包括本人和我自己的关注者)
lunique1:列表l的未列出和排序的版本,它包含所有关注者的关注者
matrix:我们创建的具有以下尺寸的矩阵:
matrix <- matrix(, nrow=length(followers)+1, ncol = length(lunique1))
关注者:包含我所有关注者的列表。(需要nrow = length(followers + 1)中的加号1才能将自己包括在维度中
这是我创建documentTermMatrix的代码(一个仅包含值零和一的矩阵,以显示与谁链接的人)
for(x in 1 : length(followers)+1)
{
for(y in 1:length(l[x]))
{
for(z in lunique1)
{
if(lunique1[z] == l[[x]][y])
{
matrix[y][z] = 1
}
else
matrix[y][z] = 0
}}}
我还没有R的经验,但是此代码需要在今晚之前工作。我希望你们能帮助我,因为我真的没有主意:(
提前致谢
有一种无需tm包即可创建文档术语矩阵的方法,下面的链接提供了一个过程。您可以使用类似的方法,这是链接
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句