鉴于单个节点具有多个GPU,是否有一种方法可以根据请求的GPU数量自动限制CPU和内存使用?
特别是,如果用户作业脚本请求2个GPU,则该作业应自动限制为2*BaseMEM
and 2*BaseCPU
,whereBaseMEM = TotalMEM/numGPUs
和BaseCPU=numCPUs/numGPUs
,这将在每个节点的基础上进行定义。
是否可以通过这种方式配置SLURM?如果不是,是否可以“虚拟地”将一台多GPU的计算机拆分为具有适当CPU和MEM数量的多个节点?
在命令行上
--cpus-per-gpu $BaseCPU --mem-per-gpu $BaseMEM
在slurm.conf中
DefMemPerGPU=1234
DefCpuPerGPU=1
由于您不能在slurm.conf中使用变量,因此您需要编写一个小的bash命令来计算$ BaseCPU和$ BaseMEM
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句