State对象中的map在所有节点上都相同吗？

debugcn 发表于 Dev

弗拉德

此Spark应用程序在3个节点上运行。我有一个包含HashMap的State对象（MessageState）。该HashMap包含一个Graph（键叶，父级值）（不，GraphX并非为此的解决方案）假设State对象将变大以适合一个节点，因此它将分布在其他2个节点上。如果我想知道叶子是最上层的父级（它将做一些递归功能遍历整个地图），是否有可能说叶子在节点3上，而最上层的父级在节点1上，它不会找到它或由火花分布来解决这个问题，因此整个地图数据都可用于搜索。我的问题实际上是国家分配如何运作。

JavaPairDStream<String, String> inputMessagesStream = readFromKafkaStream1();
   Function3<String, Optional<String>, State<MessageState>, String> messageState = (key, value, state) -> {
                //MessageState contains the HashMap
                if (state.exists()) {
                    return state.get().process(value.get());
                } else {
                    MessageState ms = new MessageState();
                    ms.process(value.get());
                    state.update(ms);
                    return null;
                }
            };

JavaMapWithStateDStream<String, String, MessageState, String> message1 = inputMessagesStream.mapWithState(StateSpec.function(messageState));

阿列克谢·罗曼诺夫（Alexey Romanov）

“通过将函数应用于此流的每个键值元素，同时为每个唯一键维护一些状态数据，来返回JavaMapWithStateDStream 。”

由于a中单个键的所有值PairRDDStream都在单个节点上，因此该键的状态也位于同一节点上（如果值太多，它们可能会出现在多个节点上，但是Spark仍将尝试最小化它必须传输的数据量）。您无法访问来自的其他键的状态mapWithState，因此“是否有可能说叶子在节点3上，而最高父节点在节点1上却找不到它”不适用。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-29

我来说两句

0条评论

登录后参与评论

来自分类Dev

Related 相关文章

文章

State对象中的map在所有节点上都相同吗？

State对象中的map在所有节点上都相同吗？

使活动规模在所有设备上都相同吗？- 安卓

Spark是否在所有节点上都支持用户定义的内存中数据结构？

unordered_map存储桶中的所有元素都具有相同的哈希值吗？

OpenGL阴影贴图在所有对象上均相同

检查列是否在所有行上都具有相同的值

在所有网页上都保留页眉和页脚吗？

如何在所有元素都相同的python中创建2D列表？

如何在所有Docker Swarm节点上运行相同的容器

在网页上，所有文本框都具有相同的 ID，我想通过 Chrome 控制台中的 JavaScript 在所有框中写入相同的文本

在所有时间，BlockingQueue在所有线程上看起来都一样吗？

我应该在所有脚本上都添加* .sh和* .rb文件扩展名吗？

链表中的所有节点都相同，似乎插入不起作用

\\ d \\ d \\ d和\\ d {3}这两种语法在所有环境中是否都相同？

\\ d \\ d \\ d和\\ d {3}这两种语法在所有环境中是否都相同？

为什么PDB似乎不像普通Python解释器那样在所有对象上都支持help（）？

我的连接对象可以在所有表单上使用吗？

如何处理iPhone 4s，5和6的屏幕尺寸，以及如何使所有内容在所有设备上看起来都相同

time（）在所有位置（时区）返回相同的值吗？

在所有节点上投射阴影SCNLight

Sigma.js边界在所有节点上

Sigma.js边界在所有节点上

在所有群集节点上创建用户

Java中的所有数组都实现相同的接口吗？

我可以省略site.pp在所有节点上执行一个类吗

在Spark中，在所有工作线程上拥有静态对象的正确方法是什么？

在所有ViewController上应用相同的逻辑

在所有线程上读取相同的结构

在所有行上强制使用相同的颜色

在所有设备上使引导箱的高度相同