Ascend Operator
应用场景
MindCluster提供Ascend Operator组件,输入集合通信所需的主进程IP、静态组网集合通信所需的ranktable信息、当前pod的rankId等信息。
组件功能
- 创建pod,并将集合通信参数按照环境变量的方式注入。
- 创建ranktable文件,并按照共享存储或configmap的方式挂载到容器,优化集合通信建链性能。
组件上下游依赖
图1 组件上下游依赖


- 通过MindCluster Volcano感知当前任务所需资源是否满足。
- 资源满足后,针对任务创建对应的pod并注入集合通信参数的环境变量。
- pod创建完成后,MindCluster Volcano进行资源的最终选定。
- 从Ascend Device Plugin获取任务的芯片编号、IP、rankId信息,汇总后生成集合通信文件。
- 通过共享存储或configmap,将集合通信文件挂载到容器内。
父主题: 组件介绍