SPSS-在因素分析后使用K-means聚类

Jeremy K 发表于 Dev

杰里米·K

我是一名开发人员，负责研究如何使用SPSS收集以前的结果，因此我们可以使用一些新数据重复该过程。我们不能问做原始分析的人，因为可悲的是他不再与我们在一起了，所以我不得不去解释他的所作所为。

我不是统计学家，不需要了解所涉及的原则。我真的只需要知道要导航到哪些菜单项。

我们进行了一项调查，询问了10,000人的很多问题。这些问题中的15个子集正在用于分析。

我知道已进行因子分析以将数据减少到4组。然后使用K均值聚类来查找聚类中心。这就是我现在想要的。

我已经研究出如何进行因子分析以获得与我数据库中的数据相匹配的成分得分系数矩阵。这是通过转到分析>降维>因子来完成的。然后，我从“提取”部分中选择了固定数量的因子（4），从“旋转”部分中选择了“ Varimax”旋转，并在“分数”部分中选中了“显示因子得分系数矩阵”。

这给出了这样的数据：

矩阵值1值2值3值4 
Q1        -0.0756 0.2134 -0.0245 -0.1236
 Q2        ... ... ... ...
 Q3        ... ... ... ...
...

我不知道该如何进行k均值聚类。

我在数据库中得到的结果如下所示：

群集中心值1值2值3值4值5 
FAC1_1             -0.8373 -0.5766 0.2100 1.3499 0.2940
 FAC2_1             ... ... ... ... ...
 FAC3_1             ... ... ... ...。 ..
 FAC4_1             ... ... ... ... ...

现在，我知道可以通过使用“分析”>“分类”>“ K-means聚类”对原始数据集进行k-means聚类，但是我不知道如何引用已经完成的因子分析。

有人可以给我一些有关如何使用SPSS创建这些集群中心的见解吗？

吉涅什·苏塔尔

在用于FACTOR分析的GUI（“分析”>“降维”>“因子”）中，有一个子对话框“分数”，请确保选中“另存为变量”。

这会将因子得分保存在数据中，即变量FAC1_1，FAC2_1，FAC3_1，FAC4_1。

然后需要将这些变量添加为K-means GUI中的输入变量。

最好以语法来设置您的工作，这样，如果任何其他人想要复制您的工作，他们都可以这样做（理想情况下，您的前任也应该把他的面包屑也留在语法文档中。我会尽一切努力来找到它）文档（如果存在的话极少存在）（。sps文件扩展名）。

这是您在语法上进行设置的方式以及他/她的工作状况：

/* Replicate the factor analysis (four factors) and save the factor score variables */.
FACTOR
  /VARIABLES < INPUT THE 15 VARIABLES HERE >
  /MISSING LISTWISE 
  /ANALYSIS < INPUT THE 15 VARIABLES HERE >
  /PRINT EXTRACTION ROTATION FSCORE
  /FORMAT SORT BLANK(.10)
  /PLOT ROTATION
  /CRITERIA FACTORS(4) ITERATE(25)
  /EXTRACTION PC
  /CRITERIA ITERATE(25)
  /ROTATION VARIMAX
  /SAVE REG(ALL)
  /METHOD=CORRELATION.

 /* Replicate the clustering using factor scores as inputs, generating 5 segments */.
QUICK CLUSTER FAC1_1 FAC2_1 FAC3_1 FAC4_1
  /MISSING=LISTWISE
  /CRITERIA=CLUSTER(5) MXITER(10) CONVERGE(0)
  /METHOD=KMEANS(NOUPDATE)
  /SAVE CLUSTER (Seg5)
  /PRINT INITIAL.

/* Check centroids match*/.
MEANS FAC1_1 FAC2_1 FAC3_1 FAC4_1 BY Seg5 /CELLS MEAN.

如果您可以复制FACTOR得分变量以使其完全匹配，那么这是一个很好的开始，如果质心不匹配，则在给定因子得分匹配的情况下，它只能/最有可能是因为段分配现在不同的。尽管案例排序不同于以前使用了相同的输入/方法，但由于随机起始点，K-Means QUICK CLUSTER可以而且很可能会产生不同的段分配。

我对此一无所知，但原则上这些是他（她）采取的可能步骤。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-21

我来说两句

0条评论

登录后参与评论

上一篇：MarkLogic 8 NodeJS Angular JSON事务

来自分类Dev

Related 相关文章

文章

SPSS-在因素分析后使用K-means聚类

SPSS-在因素分析后使用K-means聚类

（C ++）K-Means聚类问题

（C ++）K-Means聚类问题

python k-means聚类文本

如何使用 k-means 聚类获得更多特征

如何在Python中使用K-Means聚类找到最佳数量的聚类

K-Means VS K-模式？（文本聚类）

由于聚类的自动索引与真实标签不匹配，如何评估K-Means聚类？

由于聚类的自动索引与真实标签不匹配，如何评估K-Means聚类？

kdtree是否用于加快k-means聚类？

在线k-means中聚类数量的良好估计

如何找到 k-means 聚类的数值区间？

python中的k-means聚类多列数据

KNN 或 K-Means 聚类的 Python 示例

NER后如何使用k-means算法进行属性聚类？

无法使用SPSS Modeler 16运行k-means

经过增白转换和K-means聚类（python）后如何识别数据

经过增白转换和K-means聚类（python）后如何识别数据

K-means 聚类：根据聚类中数据点的最大大小确定最佳质心数

将k-means聚类与Silhouette函数一起使用时，如何选择k？

使用 k-means 将标签聚类到类别中

使用python对词袋模型进行简单的k-means聚类

为什么用K-means算法优于Kruskal算法进行聚类

如何为K-means聚类算法找到silhouette_score

如何从图像中去除背景以有效地应用 k-means 聚类

k-means聚类中holdout集的目的是什么？

Gensim Doc2vec 模型聚类成 K-means

部分定义 scikit-learn K-Means 聚类的初始质心

Python/K-means 聚类：具有随机颜色的颜色质心

使用scikit-learn.k-means库输出最接近每个聚类中心的50个样本