就Spark DataFrame / SQL上下文而言,UDF和自定义表达式之间有什么区别?尤其是它们对Catalyst都是不透明的吗?使用一个vs另一个的原因是什么?
(例如,此处提到了自定义表达式-尽管在这种情况下不需要它们。)
UDF:
表达:
两者-都是不透明的,除非有特定表达的催化剂规则支持
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
点击生成二维码
我来说两句