支持下载的软件包和OS
使用MindCluster Ascend Deployer工具下载时,下载时注意事项参见下载注意事项,<OS>的取值范围参见支持的OS及架构,<PK>取值范围请参见表2。
下载注意事项
- 由于需要下载大量软件包,MindCluster Ascend Deployer工具默认开启并行下载功能,用户可以修改ascend_deployer/downloader/config.ini文件中的parallel_download字段,决定是否开启并行下载功能,1为开启,0为关闭。默认并行下载线程数为16个,用户可通过ASCEND_DEPLOYER_DOWNLOAD_MAX_SIZE环境变量修改并行数量。
 - MindCluster Ascend Deployer工具已提供源配置文件,默认使用华为源,用户可根据需要进行替换。具体可参考源配置。
 - 下载OS依赖时,为了编译安装hccl-test工具,会自动下载mpi 3.2.1和open mpi 4.1.5版本的软件包,安装时会根据已配置的待安装环境的IP类型,使用对应的依赖进行编译,IPv4格式时,安装mpi 3.2.1;IPv6格式时,安装open mpi 4.1.5。
 
支持的OS及架构
支持的操作系统  | 
操作系统版本  | 
操作系统架构  | 
使用约束  | 
|---|---|---|---|
BCLinux  | 
21.10  | 
aarch64  | 
仅适配在  | 
CTyunOS  | 
22.06  | 
aarch64  | 
  | 
CULinux  | 
3.0  | 
aarch64  | 
-  | 
CentOS  | 
7.6  | 
aarch64、x86_64  | 
 
 
  | 
EulerOS  | 
2.10  | 
aarch64、x86_64  | 
EulerOS等操作系统默认禁止root用户远程连接,所以需提前配置/etc/ssh/sshd_config中PermitRootLogin为yes(个别OS配置方法有所差异,请参考OS官方指导)。安装完成后请及时关闭root用户远程连接。  | 
2.8  | 
aarch64  | 
||
2.9  | 
aarch64、x86_64  | 
||
Kylin  | 
V10(GFB)  | 
aarch64  | 
-  | 
V10Tercel(SP1)  | 
aarch64、x86_64  | 
||
V10Sword(SP2)  | 
aarch64  | 
||
V10Lance(SP3)  | 
aarch64  | 
||
openEuler  | 
20.03LTS  | 
aarch64、x86_64  | 
-  | 
22.03LTS  | 
aarch64、x86_64  | 
Atlas 300I Duo 推理卡支持部署24.1.RC2及以后版本的NPU固件与驱动。  | 
|
UOS  | 
20-1020e  | 
aarch64  | 
UOS 20-1020e和20-1050u2e系统上,MindCluster Ascend Deployer工具不支持安装昇腾软件包所需系统依赖,需参考UOS系统安装依赖手动安装后再使用工具进行部署。  | 
20-1050u2e  | 
aarch64  | 
||
Ubuntu  | 
18.04  | 
aarch64、x86_64  | 
-  | 
20.04  | 
aarch64、x86_64  | 
-  | 
|
22.04  | 
aarch64、x86_64  | 
Atlas 300I Pro 推理卡支持部署NPU固件与驱动的24.1.0及以后版本。 Atlas 300I Duo 推理卡支持部署NPU固件与驱动的24.1.RC2及以后版本。  | 
|
说明 
  | 
|||
支持下载的软件包
可选参数  | 
下载包含的软件包  | 
使用约束  | 
|---|---|---|
CANN  | 
nnae、nnrt、tfplugin、toolkit、kernels  | 
  | 
NPU  | 
npu(driver、firmware)  | 
NPU固件与驱动24.1.0版本中暂不提供Atlas 300I Pro 推理卡、Atlas 300I Duo 推理卡、Atlas 300V 视频解析卡、Atlas 300V Pro 视频解析卡的相关硬件包,请自行下载准备。  | 
MindCluster 性能测试  | 
toolbox  | 
-  | 
MindCluster 集群调度  | 
ascend-device-plugin,ascend-docker-runtime,hccl-controller,noded,npu-exporter,volcano,ascend-operator,resilience-controller,clusterd,mindio  | 
  | 
MindCluster 故障诊断  | 
fault-diag  | 
-  | 
MindSpore  | 
MindSpore  | 
|
TensorFlow  | 
TensorFlow  | 
|
Torch-npu  | 
torch-npu、torch  |