集群调度组件基于业界流行的集群调度系统Kubernetes,增加了昇腾AI处理器(NPU)的支持,提供NPU资源管理、优化调度和分布式训练集合通信配置等基础功能。深度学习平台开发厂商可以有效减少底层资源调度相关软件开发工作量,使能用户基于MindCluster快速开发深度学习平台。
本文档是用户使用集群调度组件的指导文档,在安装和使用集群调度组件前,用户需要提前了解,并根据具体特性的特点和功能,选择需要使用的特性并。
集群调度组件的安装和使用流程如下图所示。
表 1 使用流程
[object Object][object Object]
- 本文档可能包含第三方信息、产品、服务、软件、组件、数据或内容(统称“第三方内容”)。华为不控制且不对第三方内容承担任何责任,包括但不限于准确性、兼容性、可靠性、可用性、合法性、适当性、性能、不侵权、更新状态等,除非本文档另有明确说明。在本文档中提及或引用任何第三方内容不代表华为对第三方内容的认可或保证。
- 用户若需要第三方许可,须通过合法途径获取第三方许可,除非本文档另有明确说明。