我尝试在亚马逊Sagemaker工作室上训练pytorch模型。
当我使用EC2进行以下训练时,它可以正常工作:
estimator = PyTorch(entry_point='train_script.py',
role=role,
sagemaker_session = sess,
train_instance_count=1,
train_instance_type='ml.c5.xlarge',
framework_version='1.4.0',
source_dir='.',
git_config=git_config,
)
estimator.fit({'stockdata': data_path})
它可以在经典的sagemaker笔记本(非工作室)中以本地模式工作,并具有:
estimator = PyTorch(entry_point='train_script.py',
role=role,
train_instance_count=1,
train_instance_type='local',
framework_version='1.4.0',
source_dir='.',
git_config=git_config,
)
estimator.fit({'stockdata': data_path})
但是,当我在sagemaker studio上使用相同的代码(带有train_instance_type ='local')时,它不起作用,并且出现以下错误:没有这样的文件或目录:'docker':'docker'
我尝试通过pip install安装docker,但如果在终端中使用docker命令,则找不到docker命令
这表明查找Docker服务存在问题,该服务也已确认默认情况下未在SageMaker Studio中安装Docker(确认github票证响应。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句