Apache Phoenix on Spark-无法插入Phoenix HBase表/最佳实践需要建议

debugcn 发表于 Dev

莫汉

我有一张桌子，下面的结构。

trans_count

start_time,           end_time,                count

00:00:01              00:00:10                 1000

00:00:11              00:00:20                 800

Spark会监听来自Kafka的事件，并进行10秒钟的分组，并且必须将其插入Phoenix hbase表中。

10秒钟后，我必须首先检查start_time，end_time组合是否在表中。如果存在，我们必须获取现有计数并添加新计数，然后再次向上插入。

UPSERT INTO trans_count(start_time, end_time, count) SELECT start_time, end_time, count? FROM trans_count WHERE start_time = ? AND end_time = ?

如果在上面的语句中没有添加行，则只需添加数据。

在Apache Storm中，我能够在configure方法中创建Phoenix连接对象，并且能够每10秒使用一次与UPSERT的相同连接。

在Spark中，我无法创建连接对象，也无法为RDD中的每个对象使用相同的对象。我从spark的输出将是JavaDStream>，其中start_time，end_time，count是Map中的所有键。

我最终为RDD的每次迭代创建一个连接对象，我觉得这不是正确的方法。我已经读过Phoenix连接是轻量级的，但是为每个RDD创建一个连接对象似乎不是正确的方法。

我读了一些有关相关内容的博客，但无法解决这个问题。请帮助。

注意：该应用程序是在JAVA中内置的。

莫汉

解决方案：

不是在RDD中为每个对象创建连接，而是在RDD中为每个分区创建连接并将其用于所有对象。

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-12

我来说两句

0条评论

登录后参与评论

来自分类Dev

Apache Phoenix无法连接到HBase

来自分类Dev

无法通过 hbase 启动 apache phoenix

来自分类Dev

使用Apache Phoenix查询Hbase

来自分类Dev

Spark 1.3.1上的Apache Phoenix（4.3.1和4.4.0-HBase-0.98）ClassNotFoundException

来自分类Dev

Apache Phoenix vs Hbase本机API

来自分类Dev

Apache Phoenix的列系列

来自分类Dev

由于列不匹配，在将 spark 数据帧插入到 phoenix 表时遇到问题

来自分类Dev

使用Phoenix-Spark API添加HBase时间戳

来自分类Dev

在Apache Phoenix中显示索引

来自分类Dev

Apache Phoenix中的验证查询

来自分类Dev

PHOENIX SPARK-将表加载为DataFrame

来自分类Dev

如何从Hbase访问Phoenix表

来自分类Dev

Phoenix视图无法正确读取HBase数值

来自分类Dev

如何向上插入 row_timestamp Phoenix Hbase

来自分类Dev

Apache Phoenix安装未正确完成

来自分类Dev

用于将数据插入查找表的 Phoenix 迁移或种子

来自分类Dev

Phoenix正在更改HBase表的元信息

来自分类Dev

通过Phoenix连接到Test Hbase表

来自分类Dev

在 Apache Phoenix 中更新插入非常缓慢如何提高写入性能？

来自分类Dev

Phoenix sqlline无法查询系统表SYSTEM.FUNCTION

来自分类Dev

apache tomcat启动失败，项目库文件夹中的phoenix-5.0.0-HBase-2.0-client.jar

来自分类Dev

PHOENIX SPARK-适用于BulkLoad的DataFrame

来自分类Dev

PHOENIX SPARK-适用于BulkLoad的DataFrame

来自分类Dev

JDBC模板作为Apache Phoenix的客户端

来自分类Dev

为apache phoenix导入sbt项目时出错

来自分类Dev

运行Apache Phoenix命令时的Python兼容性问题

来自分类Dev

有示例Apache Phoenix + Spring Boot + Gradle示例项目吗？

来自分类Dev

Apache phoenix并发查询失败，出现异常

来自分类Dev

在 PySpark 中运行自定义 Apache Phoenix SQL 查询

Related 相关文章

文章