在dask中的flatMap

裕化学

许多功能语言都定义了flatMap功能,其功能类似于map但可以使返回值变平Spark / pyspark拥有http://spark.apache.org/docs/latest/api/python/pyspark.html#pyspark.RDD.flatMap

什么是最好的方式来拥有它?我的代码如下所示:

import dask.bag as db
import json
from tools import get_records

records = db.read_text(json_file).map(json.loads).map(get_records)

get_records返回字典列表。我只需要将它们链接成一个序列即可。

麦考林

您可能需要.flatten方法

In [1]: import dask.bag as db

In [2]: b = db.from_sequence([1, 2, 3, 4, 5])

In [3]: def f(i):
   ...:     return list(range(i))
   ...: 

In [4]: b.map(f).compute()
Out[4]: [[0], [0, 1], [0, 1, 2], [0, 1, 2, 3], [0, 1, 2, 3, 4]]

In [5]: b.map(f).flatten().compute()
Out[5]: [0, 0, 1, 0, 1, 2, 0, 1, 2, 3, 0, 1, 2, 3, 4]

因此,可以使用两个操作“ map”和“ flatten”来代替结合使用的“ flatMap”操作,这些操作可以单独使用,也可以根据需要使用链式操作。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Scala中的flatMap实现

来自分类Dev

Swift中flatMap的定义

来自分类Dev

Scala中的FlatMap

来自分类Dev

Swift中的FlatMap和Init

来自分类Dev

了解List中的flatMap声明

来自分类Dev

flatMap或在Python 3中绑定?

来自分类Dev

Spark DataFrame.flatMap在Java中的用法

来自分类Dev

SICP中的“ flatmap”有何意义?

来自分类Dev

复杂策略中的@composite vs flatmap

来自分类Dev

在Dhall中的Optional上的`bind` /`flatMap` /`>> =`

来自分类Dev

在rxJs中与flatMap vs concatMap进行斗争

来自分类Dev

flatMap或在Python 3中绑定?

来自分类Dev

如何在flatMap函数中实现迭代

来自分类Dev

使用flatMap移除集合中的尝试失败

来自分类Dev

从Dask中的int列创建CategoricalDtype

来自分类Dev

在Windows中更新Anaconda之后的dask问题

来自分类Dev

Dask中的二维布尔索引

来自分类Dev

Dask如何从Python中的SQL Server读取

来自分类Dev

如何在dask中映射函数

来自分类Dev

哪些压缩类型支持dask中的分块?

来自分类Dev

在 dask 的本地分布中处理 =false

来自分类Dev

Martin Odersky在线scala课程中Generator中的flatMap

来自分类Dev

地图中的flatMap如何在Scala中工作?

来自分类常见问题

为什么在javascript中没有Array.prototype.flatMap?

来自分类Dev

RxJava中的concatMap和flatMap有什么区别

来自分类Dev

在Play Controller-Action中通过#flatMap()链接承诺

来自分类Dev

flatMap函数中的Apache Flink流类型不匹配

来自分类Dev

在Swift 3中,joind()或flatMap(_ :)的性能更好吗?

来自分类Dev

更新同一订阅中的flatMap并发限制