MindCluster Volcano组件支持交换机的亲和性调度。使用该功能需要上传交换机与服务器节点的对应关系以供MindCluster Volcano使用,操作步骤如下。
当前只支持训练任务进行整卡的交换机亲和性调度,不支持推理任务,也不支持静态或动态vNPU调度。
LLD文件名需要是lld.xlsx。
进入MindXDL-deploy仓库,下载“training_toolkit/training_toolkit/utils”目录中的lld_to_cm.py文件,将该文件上传到管理节点步骤1中的目录下。
python ./lld_to_cm.py --num 32
kubectl get cm -n kube-system basic-tor-node-cm
回显示例如下,表示创建成功。
NAME DATA AGE basic-tor-node-cm 1 8s