深度学习平台一般分为管理节点、计算节点、存储节点,各类节点主要功能如下:
MindX DL各组件安装位置如表1所示。
安装位置 |
组件 |
---|---|
管理节点 |
HCCL-Controller |
Volcano |
|
Resilience-Controller |
|
计算节点 |
Ascend Device Plugin |
NPU-Exporter |
|
NodeD |
|
训练容器内 |
Elastic-Agent |
若管理节点同时也是计算节点,并且配置昇腾系列AI处理器,则管理节点也需要安装计算节点的组件。