支持的产品形态和OS清单

集群场景下的管理节点、计算节点和存储节点支持的产品形态各不相同;其中计算节点支持的产品形态和单机场景支持的产品形态一致。

集群场景

单机场景

表1 支持的产品形态

产品系列

产品名称

Atlas 训练系列产品

训练服务器(插Atlas 300T 训练卡(型号 9000)

训练服务器(插Atlas 300T Pro 训练卡(型号 9000)

Atlas 800 训练服务器(型号 9000)

Atlas 800 训练服务器(型号 9010)

Atlas 900 PoD(型号 9000)

Atlas 900T PoD Lite

Atlas A2 训练系列产品

Atlas 200T A2 Box16 异构子框

Atlas 800T A2 训练服务器

Atlas 900 A2 PoD 集群基础单元

Atlas 900 A2 PoDc 集群基础单元

Atlas A3 训练系列产品

Atlas 900 A3 SuperPoD 超节点

Atlas 9000 A3 SuperPoD 集群算力系统

Atlas 800T A3 超节点服务器

Atlas 推理服务器系列产品

推理服务器(插Atlas 300I 推理卡

Atlas 800 推理服务器(型号 3000)支持插入Atlas 300I 推理卡(型号 3000)Atlas 300I 推理卡(型号 3010)Atlas 300I Pro 推理卡Atlas 300V 视频解析卡Atlas 300V Pro 视频解析卡Atlas 300I Duo 推理卡使用

Atlas 800 推理服务器(型号 3010)支持插入Atlas 300I 推理卡(型号 3010)Atlas 300I Pro 推理卡Atlas 300V 视频解析卡Atlas 300V Pro 视频解析卡Atlas 300I Duo 推理卡使用

Atlas 推理系列产品

推理服务器(插Atlas 300I Pro 推理卡

推理服务器(插Atlas 300V Pro 视频解析卡

推理服务器(插Atlas 300I Duo 推理卡

推理服务器(插Atlas 300V 视频解析卡

Atlas 200I SoC A1 核心板

Atlas 800I A2 推理服务器

Atlas 800I A2 推理服务器

Atlas 800I A3 超节点服务器

Atlas 800I A3 超节点服务器

A200I A2 Box 异构组件

A200I A2 Box 异构组件

A200T A3 Box8 超节点服务器

A200T A3 Box8 超节点服务器

以下硬件产品,仅Ascend Docker Runtime组件支持。

Atlas 200/300/500 推理产品

Atlas 200 AI加速模块(RC场景)

Atlas 300I 推理卡(型号 3000)

Atlas 300I 推理卡(型号 3010)

Atlas 500 智能小站(型号 3000)

Atlas 200I/500 A2 推理产品

Atlas 200I A2 加速模块

Atlas 200I DK A2 开发者套件

Atlas 500 A2 智能小站

注:

6.0.RC2及以上版本支持Ascend Device PluginAscend Docker Runtime组件安装在Atlas 9000 A3 SuperPoD 集群算力系统上,用于设备发现、设备挂载和超节点信息上报。

6.0.RC2及以上版本支持NPU Exporter组件安装在Atlas 9000 A3 SuperPoD 集群算力系统上,用于监测Atlas 9000 A3 SuperPoD 集群算力系统的相关数据信息。

6.0.RC2及以上版本支持在Atlas 900 A3 SuperPoD 超节点上使用Ascend Operator组件的资源监测、整卡调度和断点续训特性。

Atlas 900 A3 SuperPoD 超节点Atlas 9000 A3 SuperPoD 集群算力系统属于训练集群设备。

支持的操作系统

表2 支持的操作系统

产品名称

操作系统

Atlas 800 训练服务器(型号 9000)

  • CentOS 7.6 for ARM
  • Kylin V10 SP2 for ARM
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu 20.04 + 5.15.0-25-generic kernel for ARM
  • Ubuntu 20.04 + 5.4.0-26-generic kernel for ARM
  • UOS V20 1020e for ARM

Atlas 800 训练服务器(型号 9010)

  • CentOS 7.6 for x86
  • Kylin V10(OpenEuler) SP1 for x86
  • openEuler 20.03 for x86
  • Ubuntu 18.04.1 for x86
  • Ubuntu 18.04.5 for x86
  • Ubuntu 20.04 for x86

Atlas 900 PoD(型号 9000)

  • CentOS 7.6 for ARM
  • Kylin V10 SP2
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu 20.04 for ARM
  • UOS V20 1020e for ARM

Atlas 200T A2 Box16 异构子框

  • Debian10.0 for x86
  • Ubuntu22.04 for x86
  • Ubuntu20.04.1 for x86
  • Ubuntu22.04.1 for x86(5.16.20-051620-generic)
  • Debian 11.7(kernel 5.10.103)
  • Tlinux 3.1 for x86
  • Tlinux 3.2 for x86
  • openEuler 22.03 LTS SP4 for x86
  • openEuler 24.03 LTS for x86

Atlas 800T A2 训练服务器

  • CentOS 7.6 for ARM
  • CTYunOS 22.06 for ARM
  • Kylin V10 SP2 for ARM
  • openEuler 22.03 for ARM
  • UOS V20 1050u2e for ARM
  • Ubuntu 22.04 for ARM
  • openEuler 22.03 LTS SP2 for ARM
  • openEuler 22.03 LTS SP4 for ARM

Atlas 900 A2 PoD 集群基础单元

  • BC-Linux-for-Euler-21.10 for ARM
  • Kylin V10 SP2 for ARM
  • CTYunOS 22.06 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu 22.04 for ARM
  • HCE 2.0

Atlas 900 A2 PoDc 集群基础单元

openEuler 22.03 LTS SP4 for ARM

Atlas 900 A3 SuperPoD 超节点

  • HCE 2.0
  • Debian 10.2
  • BC-Linux_21.10 U4 for ARM
  • MTOS

Atlas 9000 A3 SuperPoD 集群算力系统

  • HCE 2.0
  • Debian 10.2

Atlas 800T A3 超节点服务器

openEuler 22.03 LTS SP4 for ARM

A200T A3 Box8 超节点服务器

Tlinux 3.1 for x86

Atlas 200I SoC A1 核心板

openEuler 20.03 for ARM

A200I A2 Box 异构组件

velinux 1.2 for x86

Atlas 800I A2 推理服务器

  • BC-Linux-for-Euler-21.10 for ARM
  • Euler 2.12 for ARM
  • CentOS 7.6 for ARM
  • CTYunOS 22.06 for ARM
  • Kylin V10 SP2 for ARM
  • Kylin V10 SP3 for ARM
  • openEuler 22.03 for ARM
  • UOS V20 1050u2e for ARM
  • Ubuntu 22.04 for ARM

Atlas 800I A3 超节点服务器

openEuler 22.03 LTS SP4 for ARM

A800-3010+A300T-9000

  • CentOS 7.6 for x86
  • Kylin Linux Advanced Server V10 SP1 for x86
  • openEuler 20.03 for x86
  • openEuler 22.03 for x86
  • Ubuntu 18.04.1 for x86
  • Ubuntu 20.04 for x86

A800-3000+A300-3000

  • CentOS 7.6 for ARM
  • Kylin V10(OpenEuler) SP1 for ARM
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu20.04 for ARM
  • UOS V20 1020e for ARM

A800-3000+A300-3010

  • Ubuntu20.04 for ARM
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • CentOS 7.6 for ARM
  • Kylin V10 SP1 for ARM
  • UOS V20 1020e for ARM
  • Euler 2.13 for ARM

A800-3000+Atlas 300I Duo

  • Ubuntu 20.04 for ARM
  • Euler 2.12
  • Euler 2.13 for ARM
  • Debian 10.2
  • HCS 8.5.0(Euler 2.12 ARM)
  • HCE 2.0仅Atlas 300I Duo 推理卡支持
  • BC-Linux_21.10 for ARM
  • Euler 2.13 for ARM
  • HCE 2.0.2503 for x86

A800-3000+Atlas 300I Pro

  • CentOS 7.6 for ARM
  • Kylin Linux Advanced Server V10 SP1 for ARM
  • Kylin Linux Advanced Server V10 SP2 for ARM
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu 20.04 for ARM
  • Euler 2.12
  • Euler 2.13 for ARM
  • Debian 10.2
  • HCS 8.5.0(Euler 2.12 ARM)
  • HCE 2.0仅Atlas 300I Pro 推理卡支持
  • HCE 2.0.2503 for x86

A800-3000+Atlas 300V Pro

  • CentOS 7.6 for ARM
  • Kylin Linux Advanced Server V10 SP1 for ARM
  • Kylin Linux Advanced Server V10 SP2 for ARM
  • openEuler 20.03 for ARM
  • openEuler 22.03 for ARM
  • Ubuntu 20.04 for ARM
  • Euler 2.13 for ARM
  • HCE 2.0.2503 for x86

A800-3000+Atlas 300V

  • openEuler 22.03 for ARM
  • Ubuntu 20.04 for ARM
  • Euler 2.13 for ARM
  • HCE 2.0.2503 for x86

A800-3010+A300-3010

  • CentOS 7.6 for x86
  • Kylin V10 SP1 for x86
  • openEuler 20.03 for x86
  • openEuler 22.03 for x86
  • Ubuntu 18.04.1 for x86
  • Ubuntu 18.04.5 for x86
  • Ubuntu 20.04 for x86

A800-3010+Atlas 300I Pro

A800-3010+Atlas 300V Pro

  • CentOS 7.6 for x86
  • Kylin Linux Advanced Server V10 SP1 for x86
  • openEuler 20.03 for x86
  • openEuler 22.03 for x86
  • Ubuntu 20.04 for x86

A800-3010+Atlas 300V

  • openEuler 22.03 for x86
  • Ubuntu 20.04 for x86

注:

  • A800-3000+A300-3000为对应服务器插相应的推理卡的缩写,表示Atlas 800 推理服务器(型号 3000)上插Atlas 300I 推理卡(型号 3000)
  • 边缘硬件产品如Atlas 500 A2 智能小站,仅支持使用Ascend Docker Runtime组件,支持的操作系统以硬件产品本身为准,此处不再说明。

硬件规格要求

硬件产品需要满足如下要求。
表3 资源要求

名称

要求

内存

管理节点内存>64GB

磁盘空间

>1TB

磁盘空间规划请参见表1

网络

  • 带外管理(BMC):≥1Gbit/s
  • 带内管理(SSH):≥1Gbit/s
  • 业务面:≥10Gbit/s
  • 存储面:≥25Gbit/s
  • 参数面:100Gbit/s或200Gbit/s