由于LIWC软件和词典是专有的,我很高兴看到它们似乎与仍在开发中但性能卓越的R软件包Quanteda很好地配合使用。
R包Quanteda的文档证明了它与LIWC格式字典一起使用,以及本SO post一样。
我购买了LIWC 2015,但除了将PDF导出为PDF外,无法弄清楚如何将词典导出到应用程序之外。
根据接受性要求进行编辑(“ LIWC的商业方面”)
我不建议您如何从Java Archive(.jar)文件中提取英语LIWC 2015词典,该文件包含需要购买的软件。
与早期版本的LIWC软件不同,词典文件不会直接随该软件一起分发。但是,使用合法购买的序列号登录后,您可以从http://dictionaries.liwc.net下载LIWC2007和LIWC2001(取决于语言)的非英语词典,其中包括德语,荷兰语,意大利语,俄语,法语和西班牙语版本。
如果您拥有与LIWC字典相同格式的字典,例如Moral Foundations字典,那么它将起作用:
require(quanteda)
mfdict <- dictionary(file = "http://www.moralfoundations.org/sites/default/files/files/downloads/moral%20foundations%20dictionary.dic",
format = "LIWC")
它将载入《道德基础》词典并将其转换为Quanteda格式。您可以使用字典来构造文档特征矩阵,方法是使用
dfm(x, dictionary = mfdict)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句