我试图找出我在Databricks中使用的python版本。
为了找出我尝试过的
import sys
print(sys.version)
我得到的输出为3.7.3
但是当我去集群-> SparkUI->环境时
我看到群集Python版本是2。
这是指哪个版本?
当我尝试跑步时
%sh python --version
我仍然得到Python 3.7.3
每个工作程序/驱动程序节点可以有不同的python版本吗?
注意:我正在使用一个安装程序,其中有1个工作程序节点和1个驱动程序节点(总共2个具有相同规格的节点),并且Databricks运行时版本为6.5 ML
更新:此问题已修复。
对于新集群:如果创建一个新集群,则其python环境变量为3。
对于现有群集:您需要在“群集配置” >“高级”中的“环境变量”选项卡中添加,它会在“环境变量”中更改。
PYSPARK_PYTHON = /数据块/ python3 / bin / python3
谢谢让我们注意到这个。这是一个产品错误,目前我正在与产品团队合作,以尽快解决此问题。
使用UI创建的集群的默认Python版本是Python 3。
作为repro的一部分,我创建了Databricks Runtime Version:6.5 ML,并观察到了相同的行为。
群集-> SparkUI->环境显示不正确的版本。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句