我是一名开发人员,负责研究如何使用SPSS收集以前的结果,因此我们可以使用一些新数据重复该过程。我们不能问做原始分析的人,因为可悲的是他不再与我们在一起了,所以我不得不去解释他的所作所为。
我不是统计学家,不需要了解所涉及的原则。我真的只需要知道要导航到哪些菜单项。
我们进行了一项调查,询问了10,000人的很多问题。这些问题中的15个子集正在用于分析。
我知道已进行因子分析以将数据减少到4组。然后使用K均值聚类来查找聚类中心。这就是我现在想要的。
我已经研究出如何进行因子分析以获得与我数据库中的数据相匹配的成分得分系数矩阵。这是通过转到分析>降维>因子来完成的。然后,我从“提取”部分中选择了固定数量的因子(4),从“旋转”部分中选择了“ Varimax”旋转,并在“分数”部分中选中了“显示因子得分系数矩阵”。
这给出了这样的数据:
矩阵值1值2值3值4 Q1 -0.0756 0.2134 -0.0245 -0.1236 Q2 ... ... ... ... Q3 ... ... ... ... ...
我不知道该如何进行k均值聚类。
我在数据库中得到的结果如下所示:
群集中心值1值2值3值4值5 FAC1_1 -0.8373 -0.5766 0.2100 1.3499 0.2940 FAC2_1 ... ... ... ... ... FAC3_1 ... ... ... ...。 .. FAC4_1 ... ... ... ... ...
现在,我知道可以通过使用“分析”>“分类”>“ K-means聚类”对原始数据集进行k-means聚类,但是我不知道如何引用已经完成的因子分析。
有人可以给我一些有关如何使用SPSS创建这些集群中心的见解吗?
在用于FACTOR分析的GUI(“分析”>“降维”>“因子”)中,有一个子对话框“分数”,请确保选中“另存为变量”。
这会将因子得分保存在数据中,即变量FAC1_1,FAC2_1,FAC3_1,FAC4_1。
然后需要将这些变量添加为K-means GUI中的输入变量。
最好以语法来设置您的工作,这样,如果任何其他人想要复制您的工作,他们都可以这样做(理想情况下,您的前任也应该把他的面包屑也留在语法文档中。我会尽一切努力来找到它)文档(如果存在的话极少存在)(。sps文件扩展名)。
这是您在语法上进行设置的方式以及他/她的工作状况:
/* Replicate the factor analysis (four factors) and save the factor score variables */.
FACTOR
/VARIABLES < INPUT THE 15 VARIABLES HERE >
/MISSING LISTWISE
/ANALYSIS < INPUT THE 15 VARIABLES HERE >
/PRINT EXTRACTION ROTATION FSCORE
/FORMAT SORT BLANK(.10)
/PLOT ROTATION
/CRITERIA FACTORS(4) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/SAVE REG(ALL)
/METHOD=CORRELATION.
/* Replicate the clustering using factor scores as inputs, generating 5 segments */.
QUICK CLUSTER FAC1_1 FAC2_1 FAC3_1 FAC4_1
/MISSING=LISTWISE
/CRITERIA=CLUSTER(5) MXITER(10) CONVERGE(0)
/METHOD=KMEANS(NOUPDATE)
/SAVE CLUSTER (Seg5)
/PRINT INITIAL.
/* Check centroids match*/.
MEANS FAC1_1 FAC2_1 FAC3_1 FAC4_1 BY Seg5 /CELLS MEAN.
如果您可以复制FACTOR得分变量以使其完全匹配,那么这是一个很好的开始,如果质心不匹配,则在给定因子得分匹配的情况下,它只能/最有可能是因为段分配现在不同的。尽管案例排序不同于以前使用了相同的输入/方法,但由于随机起始点,K-Means QUICK CLUSTER可以而且很可能会产生不同的段分配。
我对此一无所知,但原则上这些是他(她)采取的可能步骤。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句