如何在pyspark中获得模型的预测

debugcn 发表于 Dev

eya_bklt

我已经使用pyspark开发了一个聚类模型，我只想预测一个向量的类，这是代码

spark = SparkSession.builder.config("spark.sql.warehouse.dir", 
            "file:///C:/temp").appName("Kmeans").getOrCreate()
 vecAssembler = VectorAssembler(inputCols=FEATURES_COL, outputCol="features")
 df_kmeans = vecAssembler.transform(df).select('LCLid', 'features')
 k = 6
 kmeans = KMeans().setK(k).setSeed(1).setFeaturesCol("features")
 model = kmeans.fit(df_kmeans)
 centers = model.clusterCenters()
 predictions = model.transform(df_kmeans)
 transformed = model.transform(df_kmeans).select('LCLid', 'prediction')
 rows = transformed.collect()

说我有一个特征V的向量，我想预测它属于哪个类，我尝试了一种在此链接http://web.cs.ucla.edu/~zhoudiyu/tutorial/中找到的方法，但它没有无法正常工作，因为我不在SparkContext中使用SparkSession

纳瑟雷丁·贝尔吉斯

我看到您已经完成了模型创建中最基本的步骤，您仍然需要在要进行聚类的向量上应用k-means模型（例如您在第10行所做的操作），然后获得预测，我的意思是，您要做的是重新做第10行中所做的相同工作，但要对功能V的新向量进行重新理解。为了进一步了解这一点，我邀请您阅读StackOveflow中的已发布答案：PySpark中的KMeans聚类。我还想补充一点，您所关注的示例中的问题不是由于使用SparkSession或SparkContext引起的，因为这些只是Spark API的入口点，您还可以通过sparkSession访问sparContext，因为它自Spark 2.0起由Databricks统一。pyspark k-means就像Scikit一样，唯一的区别是spark python API（PySpark）中的预定义函数。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-04-6

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

如何在pyspark中获得模型的预测

如何在pyspark中获得模型的预测

如何在Swift 5中从MLModel（机器学习模型）获得预测的信心

如何从R中的线性模型获得1000个预测？

如何从这些预训练模型中获得预测？

如何获得模型预测的最后索引？

如何获得分类模型的预测概率？

如何在sklearn中获得关于隔离林的顶级预测

如何在pystan中获得预测后验？

如何在LogisticRegressionWithLBFGS中为pyspark打印预测概率

如何在多元线性回归模型中预测y值？

如何获得R中的预测精度？

如何在PySpark中获得独特的字典RDD？

如何在pyspark中获得确定性随机排序？

如何在模型的覆盖率测试中获得100％？

我如何在Django 1.8中获得所有模型

如何在Magento中获得所有可用的模型？

如何在Simulink模型中获得信号尺寸

如何在多元模型中获得平均准确度？

如何在Django Rest Framework中获得模型方法的价值？

如何在Simulink模型中获得信号尺寸

如何从预测包中获取模型信息

如何在Azure ML Web服务提供的HttpResponseMessage中获得预测分数？

如何在statsmodel ols中获得“样本内”预测值（y hat）？

如何在Matlab中获得每个观测值的预测值（独立变量）？

如何在 Tensorflow Object Detection API 中获得预测值的百分比？

如何在 SQL Server 中反序列化 R 模型以进行预测？

具有lm的线性模型：如何获得预测值总和的预测方差

如何获得预测概率？

如何在Python中使用保存模型进行预测

R：如何在mboost模型中指定预测变量