我对以下sqoop import命令有疑问
sqoop import \
--connect jdbc:mysql://localhost/userdb \
--username user_name \
--table user_table \
--m 1 \
--target-dir /sample
为什么我们在上面的命令中使用M?请说清楚
-m表示映射器,通过指定-m 1表示您只需要运行一个映射器即可导入表。这用于控制并行性。要实现并行性,squoop使用主键/唯一键从源表中拆分行。
基本上,sqoop中默认的映射器数量是4。因此,您需要使用来提及需要达到哪一列的并行性--split-by column_name
,因此,给-m 1则不需要拆分。
有关更多信息,请查看下面的链接,
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句