Apache Phoenix on Spark-无法插入Phoenix HBase表/最佳实践需要建议

莫汉

我有一张桌子,下面的结构。

trans_count

start_time,           end_time,                count

00:00:01              00:00:10                 1000

00:00:11              00:00:20                 800

Spark会监听来自Kafka的事件,并进行10秒钟的分组,并且必须将其插入Phoenix hbase表中。

10秒钟后,我必须首先检查start_time,end_time组合是否在表中。如果存在,我们必须获取现有计数并添加新计数,然后再次向上插入。

UPSERT INTO trans_count(start_time, end_time, count) SELECT start_time, end_time, count? FROM trans_count WHERE start_time = ? AND end_time = ?

如果在上面的语句中没有添加行,则只需添加数据。

在Apache Storm中,我能够在configure方法中创建Phoenix连接对象,并且能够每10秒使用一次与UPSERT的相同连接。

在Spark中,我无法创建连接对象,也无法为RDD中的每个对象使用相同的对象。我从spark的输出将是JavaDStream>,其中start_time,end_time,count是Map中的所有键。

我最终为RDD的每次迭代创建一个连接对象,我觉得这不是正确的方法。我已经读过Phoenix连接是轻量级的,但是为每个RDD创建一个连接对象似乎不是正确的方法。

我读了一些有关相关内容的博客,但无法解决这个问题。请帮助。

注意:该应用程序是在JAVA中内置的。

莫汉

解决方案:

不是在RDD中为每个对象创建连接,而是在RDD中为每个分区创建连接并将其用于所有对象。

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

Apache Phoenix无法连接到HBase

来自分类Dev

无法通过 hbase 启动 apache phoenix

来自分类Dev

使用Apache Phoenix查询Hbase

来自分类Dev

Spark 1.3.1上的Apache Phoenix(4.3.1和4.4.0-HBase-0.98)ClassNotFoundException

来自分类Dev

Apache Phoenix vs Hbase本机API

来自分类Dev

Apache Phoenix的列系列

来自分类Dev

由于列不匹配,在将 spark 数据帧插入到 phoenix 表时遇到问题

来自分类Dev

使用Phoenix-Spark API添加HBase时间戳

来自分类Dev

在Apache Phoenix中显示索引

来自分类Dev

Apache Phoenix中的验证查询

来自分类Dev

PHOENIX SPARK-将表加载为DataFrame

来自分类Dev

如何从Hbase访问Phoenix表

来自分类Dev

Phoenix视图无法正确读取HBase数值

来自分类Dev

如何向上插入 row_timestamp Phoenix Hbase

来自分类Dev

Apache Phoenix安装未正确完成

来自分类Dev

用于将数据插入查找表的 Phoenix 迁移或种子

来自分类Dev

Phoenix正在更改HBase表的元信息

来自分类Dev

通过Phoenix连接到Test Hbase表

来自分类Dev

在 Apache Phoenix 中更新插入非常缓慢如何提高写入性能?

来自分类Dev

Phoenix sqlline无法查询系统表SYSTEM.FUNCTION

来自分类Dev

apache tomcat启动失败,项目库文件夹中的phoenix-5.0.0-HBase-2.0-client.jar

来自分类Dev

PHOENIX SPARK-适用于BulkLoad的DataFrame

来自分类Dev

PHOENIX SPARK-适用于BulkLoad的DataFrame

来自分类Dev

JDBC模板作为Apache Phoenix的客户端

来自分类Dev

为apache phoenix导入sbt项目时出错

来自分类Dev

运行Apache Phoenix命令时的Python兼容性问题

来自分类Dev

有示例Apache Phoenix + Spring Boot + Gradle示例项目吗?

来自分类Dev

Apache phoenix并发查询失败,出现异常

来自分类Dev

在 PySpark 中运行自定义 Apache Phoenix SQL 查询

Related 相关文章

热门标签

归档