このstmチュートリアルの最初のステップを実行しようとしています
https://github.com/dondealban/learning-stm
このデータセットでは、元のデータセットの一部です
http://www.mediafire.com/file/1jk2aoz4ac84jn6/data.csv/file
install.packages("stm")
library(stm)
load("VignetteObjects.RData")
data <- read.csv("C:/data.csv")
head(data)
processed <- textProcessor(data$documents, metadata=data)
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
docs <- out$documents
vocab <- out$vocab
meta <- out$meta
poliblogPrevFit <- stm(out$documents, out$vocab, K=4, prevalence=~rating+s(day),
max.em.its=200, data=out$meta, init.type="Spectral",
seed=8458159)
しかし、私は同じエラーを受け取り続けます
Error in makeTopMatrix(prevalence, data) : Error creating model matrix.
This could be caused by many things including
explicit calls to a namespace within the formula.
Try a simpler formula.
誰でも64ビットMSWindowsR-3.5.2で実行できますか。同様のエラーはどこにも見つかりませんでした。
あなたの問題は、あなたが行ったサンプリングで、たった1つのレベルの因子オブジェクトになってしまったことだったようです:
> levels(meta$rating)
[1] "Conservative"
ただし、このような変数を使用しても、ケース間で変動がないため、意味がありません。元のデータを使用する場合、コードは完全に正常に機能します。
data <- read.csv("https://raw.githubusercontent.com/dondealban/learning-stm/master/data/poliblogs2008.csv")
processed <- textProcessor(data$documents, metadata = data)
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
docs <- out$documents
vocab <- out$vocab
meta <- out$meta
levels(meta$rating)
[1] "Conservative" "Liberal"
poliblogPrevFit <- stm(docs, vocab, K = 4, prevalence = ~rating+s(day),
max.em.its = 200, data = out$meta, init.type = "Spectral",
seed = 8458159)
この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。
侵害の場合は、連絡してください[email protected]
コメントを追加