支持的产品形态
MindCluster Ascend FaultDiag组件旨在昇腾训练及推理任务下,为用户提供高效定位任务失败与训练及推理性能劣化问题的能力。支持的产品如表1所示。
产品系列 |
产品名称 |
---|---|
Atlas 训练系列产品 |
Atlas 300T 训练卡(型号 9000) |
Atlas 300T Pro 训练卡(型号 9000) |
|
Atlas 800 训练服务器(型号 9000) |
|
Atlas 800 训练服务器(型号 9010) |
|
Atlas 900 PoD(型号 9000) |
|
Atlas 900T PoD Lite |
|
Atlas A2 训练系列产品 |
Atlas 200T A2 Box16 异构子框 |
Atlas 800T A2 训练服务器 |
|
Atlas 900 A2 PoD 集群基础单元 |
|
Atlas 推理系列产品 |
Atlas 300I Duo 推理卡 |
Atlas 800I A2推理产品 |
Atlas 800I A2 推理服务器(32GB HCCS款) |
Atlas 800I A2 推理服务器(32GB PCIe款) |
|
Atlas 800I A2 推理服务器(64GB HCCS款) |
|
Atlas A3 训练系列产品 |
Atlas 900 A3 SuperPoD 超节点 |
Atlas 9000 A3 SuperPoD 集群算力系统 |
|
Atlas 800I A3 超节点服务器 |
|
Atlas 800T A3 超节点服务器 |
|
A200T A3 Box8 超节点服务器 |