如何仅将某些字段插入到 hive 表中,重用现有的表架构?

马克诺金

我已经有一个配置单元表,它是在测试之前创建的,例如它有 A(字符串类型)、B(字符串)、C(数字)列。

在测试用例中,我只想插入测试数据,稍后将对其进行查询,例如在 A、B 列中。

将只有 A 列和 B 列数据的测试数据插入到包含 diff 模式的现有表中的最佳方法是什么?

在尝试执行类似操作时,我通常会遇到模式不匹配错误、列数不匹配等错误

val df = session.createDataFrame(rows, schema)
df.write.mode(SaveMode.Append).format("orc").saveAsTable(mytableName)

其中schema是现有的表模式session.table(mytableName).schemarows是包含 A 列和 B 列值的元组列表。

有没有合适的 API 来做到这一点?

如何仅将某些字段插入到 hive 表中,重用现有的表架构?

莫里亚蒂007

将新列附加到要写入表的数据框。前任 -

假设您有两行数据 - 由两个元组表示:

val rows = Seq(("1", "2"), ("3", "4"))
val df = sc.parallelize(rows).toDF("A", "B")
val newDf = df.withColumn("C", lit(null).cast(IntegerType))
// Now newDf schema will be same as your table schema
println(newDf.schema)
println(session.table(mytableName).schema) 
df.write.mode(SaveMode.Append).format("orc").saveAsTable(mytableName)

本文收集自互联网,转载请注明来源。

如有侵权,请联系[email protected] 删除。

编辑于
0

我来说两句

0条评论
登录后参与评论

相关文章

来自分类Dev

如何获取现有的Hive表的SerDe属性

来自分类Dev

如何更改现有的Hive表的FIELD TERMINATED值?

来自分类Dev

如何在HIVE中合并具有不同架构的表?

来自分类Dev

HIVE-将选择语句的结果作为多个记录插入到配置单元表中,而不会覆盖现有内容

来自分类Dev

如何将数据和表插入到现有的表中?

来自分类Dev

将空的 int 数组插入到 hive 表中

来自分类Dev

如何使用外键将值插入到现有的 SQL Server 表中

来自分类Dev

如何在将数据插入到Hive表中时转义html代码数据

来自分类Dev

将Sqoop查询到Hive表中

来自分类Dev

将某些字段(仅结构)从另一个表复制到现有表中

来自分类Dev

从Qubole将本地csv插入到Hive表

来自分类Dev

Hive:无法从 Hive 表中的文件插入数组和映射

来自分类Dev

从Hive中的现有表创建新表

来自分类Dev

MySQL-无法从现有的.sql文件运行脚本,该脚本应创建架构,其表并在Workbench中插入所有必要的数据

来自分类Dev

如何将Pandas DataFrame插入现有的PostgreSQL表中?

来自分类Dev

将2个Hive外部表的数据插入带有新列的新外部表中

来自分类Dev

如何使用sqoop将mySql服务器中的JSON字段数据导入到Hive表中

来自分类Dev

从Excel中获取数据并插入到现有的Word表中?

来自分类Dev

从Excel中获取数据并将其插入到现有的Word表中?

来自分类Dev

如何从现有的2表创建表中的默认值在oracle中

来自分类Dev

将一张以上的表合并到一张现有的表中

来自分类Dev

如何检查Hive中是否存在表?

来自分类Dev

Doom如何从现有的正弦查找表中确定其余弦查找表?

来自分类Dev

将数据表插入现有的Access文件中

来自分类Dev

如何在 scala spark 2.0 中解析 json 文件并将数据插入到 hive 表中?

来自分类Dev

如何更新Hive表行

来自分类Dev

如何在Hive表中插入时间戳?

来自分类Dev

如何在Hive表中插入时间戳?

来自分类Dev

如何通过jdbc向hive表中插入数据?

Related 相关文章

  1. 1

    如何获取现有的Hive表的SerDe属性

  2. 2

    如何更改现有的Hive表的FIELD TERMINATED值?

  3. 3

    如何在HIVE中合并具有不同架构的表?

  4. 4

    HIVE-将选择语句的结果作为多个记录插入到配置单元表中,而不会覆盖现有内容

  5. 5

    如何将数据和表插入到现有的表中?

  6. 6

    将空的 int 数组插入到 hive 表中

  7. 7

    如何使用外键将值插入到现有的 SQL Server 表中

  8. 8

    如何在将数据插入到Hive表中时转义html代码数据

  9. 9

    将Sqoop查询到Hive表中

  10. 10

    将某些字段(仅结构)从另一个表复制到现有表中

  11. 11

    从Qubole将本地csv插入到Hive表

  12. 12

    Hive:无法从 Hive 表中的文件插入数组和映射

  13. 13

    从Hive中的现有表创建新表

  14. 14

    MySQL-无法从现有的.sql文件运行脚本,该脚本应创建架构,其表并在Workbench中插入所有必要的数据

  15. 15

    如何将Pandas DataFrame插入现有的PostgreSQL表中?

  16. 16

    将2个Hive外部表的数据插入带有新列的新外部表中

  17. 17

    如何使用sqoop将mySql服务器中的JSON字段数据导入到Hive表中

  18. 18

    从Excel中获取数据并插入到现有的Word表中?

  19. 19

    从Excel中获取数据并将其插入到现有的Word表中?

  20. 20

    如何从现有的2表创建表中的默认值在oracle中

  21. 21

    将一张以上的表合并到一张现有的表中

  22. 22

    如何检查Hive中是否存在表?

  23. 23

    Doom如何从现有的正弦查找表中确定其余弦查找表?

  24. 24

    将数据表插入现有的Access文件中

  25. 25

    如何在 scala spark 2.0 中解析 json 文件并将数据插入到 hive 表中?

  26. 26

    如何更新Hive表行

  27. 27

    如何在Hive表中插入时间戳?

  28. 28

    如何在Hive表中插入时间戳?

  29. 29

    如何通过jdbc向hive表中插入数据?

热门标签

归档