我正在关注有关使用天蓝色数据块进行数据转换的教程,它说在将数据加载到天蓝色突触分析之前,先将通过天蓝色数据块转换的数据先保存在天蓝色blob存储中的临时存储中,然后再加载到天蓝色突触分析中。为什么在加载到天蓝色突触分析之前需要将其保存到临时存储中?
在读取或写入Azure Synapse时,Azure存储容器充当存储批量数据的中介。Spark使用内置连接器之一连接到存储容器:Azure Blob存储或Azure Data Lake Storage(ADLS)Gen2。
下面的体系结构图显示了如何通过每个计算节点上的数据移动服务(DMS)服务的每个HDFS桥连接到外部资源(例如Azure Blob存储)来实现此目的。然后,PolyBase在SQL数据仓库和外部资源之间双向传输数据,从而提供了快速的加载性能。
使用PolyBase提取,加载和转换数据为SQL数据仓库实现PolyBase ELT的步骤为:
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句