在一次传递数据中使用pyspark查找最小值/最大值

Azeem Akhter 发表于 Dev

阿泽姆·阿赫特（Azeem Akhter）

我有一个带有大量数字（文件中的行长）的RDD，我想知道如何单次通过数据来获取最小值/最大值。

我知道最小和最大函数，但这需要两次通过。

用户名

试试这个：

>>> from pyspark.statcounter import StatCounter
>>> 
>>> rdd = sc.parallelize([9, -1, 0, 99, 0, -10])
>>> stats = rdd.aggregate(StatCounter(), StatCounter.merge, StatCounter.mergeStats)
>>> stats.minValue, stats.maxValue
(-10.0, 99.0)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-02-28

我来说两句

0条评论

登录后参与评论

上一篇：编译后Visual Studio冻结。当我尝试启动应用程序时，资源管理器也是如此

来自分类Dev

一次迭代中的最小值，最大值和平均值

来自分类Dev

交换数组中最后一次出现的最小值和最大值

来自分类Dev

使用Comparable查找最大值/最小值

来自分类Dev

使用awk查找最小值和最大值？

来自分类Dev

Excel：使用什么公式返回一组查找值的最小值或最大值？

来自分类Dev

Postgres：一次选择即可获得最小值，最大值，合计值

来自分类Dev

Postgres：一次选择即可获得最小值，最大值，合计值

来自分类Dev

在CUDA中查找最大值/最小值而不将其传递给CPU

来自分类Dev

在Python中查找列表的最小值，最大值

来自分类Dev

查找函数的最小值和最大值

来自分类Dev

在.json中查找最大值和最小值

来自分类Dev

awk查找数组的最小值和最大值

来自分类Dev

查找局部最小值和局部最大值

来自分类Dev

在.json中查找最大值和最小值

来自分类Dev

查找矩阵的最大值和最小值

来自分类Dev

Excel公式查找最大值/最小值

来自分类Dev

查找连续行的最小值/最大值

来自分类Dev

如何使用类似名称对列数据进行分组以查找总和、最小值和最大值？

来自分类Dev

R：在数据框中查找列列表的最大值/最小值

来自分类Dev

Python数据框连续查找最小值和最大值之间的差异

来自分类Dev

熊猫数据框查找局部最大值和最小值之和

来自分类Dev

查找循环数据簇的最小值和最大值

来自分类Dev

从数组中查找最小值和最大值，最小值始终为0

来自分类Dev

从数组中查找最小值和最大值，最小值始终为0

来自分类Dev

根据数据设置dateRangeInput最小值/最大值

来自分类Dev

如何使用numpy在可变长度数组中查找最小值/最大值？

来自分类Dev

如何使用Dplyr的Summarize以及which（）查找最小值/最大值

来自分类Dev

使用半已知键在ArrayList的HashMap中查找最大值和最小值-Java

来自分类Dev

使用迭代查找最大值和最小值时的Python TypeError

Related 相关文章

文章