支持下载的软件包和OS
使用MindCluster Ascend Deployer工具下载时,下载时注意事项参见下载注意事项,<OS>的取值范围参见支持的OS及架构,<PK>取值范围请参见表2,。
下载注意事项
- 由于需要下载大量软件包,MindCluster Ascend Deployer工具默认开启并行下载功能,用户可以修改ascend_deployer/downloader/config.ini文件中的parallel_download字段,决定是否开启并行下载功能,1为开启,0为关闭。默认并行下载线程数为16个,用户可通过ASCEND_DEPLOYER_DOWNLOAD_MAX_SIZE环境变量修改并行数量。
- MindCluster Ascend Deployer工具已提供源配置文件,默认使用华为源,用户可根据需要进行替换。具体可参考源配置。
- 下载OS依赖时,为了编译安装hccl-test工具,会自动下载mpi 3.2.1和open mpi 4.1.5版本的软件包,安装时会根据已配置的待安装环境的IP类型,使用对应的依赖进行编译,IPv4格式时,安装mpi 3.2.1;IPv6格式或者Atlas A3 训练系列产品时,安装open mpi 4.1.5。
支持的OS及架构
支持的操作系统 |
操作系统版本 |
操作系统架构 |
使用约束 |
---|---|---|---|
BCLinux |
21.10 |
aarch64 |
仅适配在 |
CTyunOS |
22.06 |
aarch64 |
CTyunOS上安装MindCluster组件时,仅支持MindCluster5.0.RC2及以上版本的部分组件、1.19.16~1.25.X版本的k8s和18.09.x及以上版本Docker。 |
CULinux |
3.0 |
aarch64 |
- |
CentOS |
7.6 |
aarch64、x86_64 |
|
Debian |
10 |
aarch64 |
仅适配Atlas 900 A3 SuperPoD 集群算力系统安装Ascend HDK、CANN和ToolBox。 |
EulerOS |
2.10 |
aarch64、x86_64 |
EulerOS等操作系统默认禁止root用户远程连接,所以需提前配置/etc/ssh/sshd_config中PermitRootLogin为yes(个别OS配置方法有所差异,请参考OS官方指导)。安装完成后请及时关闭root用户远程连接。 |
2.8 |
aarch64 |
||
2.9 |
aarch64、x86_64 |
||
Kylin |
V10(GFB) |
aarch64 |
- |
V10Tercel(SP1) |
aarch64、x86_64 |
||
V10Sword(SP2) |
aarch64 |
||
V10Lance(SP3) |
aarch64 |
||
openEuler |
20.03LTS |
aarch64、x86_64 |
- |
22.03LTS |
aarch64、x86_64 |
||
UOS |
20-1020e |
aarch64 |
UOS 20-1020e和20-1050u2e系统上,MindCluster Ascend Deployer工具不支持安装昇腾软件包所需系统依赖,需参考UOS系统安装依赖手动安装后再使用工具进行部署。 |
20-1050u2e |
aarch64 |
||
Ubuntu |
20.04 |
aarch64、x86_64 |
- |
22.04 |
aarch64、x86_64 |
- |
|
18.04 |
aarch64、x86_64 |
- |
|
说明:
|
支持下载的软件包
可选参数 |
下载包含的软件包 |
使用约束 |
---|---|---|
CANN |
nnae、nnrt、tfplugin、toolkit、kernels |
使用MindCluster Ascend Deployer工具下载CANN的软件包时,可以使用pip3工具执行pip3 install esdk-obs-python==3.23.12安装指定版本的esdk-obs-python,启用CANN软件包断点续传功能,防止出现因软件包较大、网络原因导致下载失败或者重新下载耗时较久的情况。 |
NPU |
npu(driver、firmware) |
- |
MindCluster性能测试 |
toolbox |
- |
MindCluster集群调度 |
ascend-device-plugin,ascend-docker-runtime,hccl-controller,noded,npu-exporter,volcano,ascend-operator,resilience-controller,clusterd,mindio |
部署MindIO时,请参考下载昇腾软件下载OS系统依赖后,再手动安装dos2unix依赖(示例:apt-get install dos2unix)。 |
MindCluster故障诊断 |
fault-diag |
- |
MindSpore |
MindSpore |
|
TensorFlow |
TensorFlow |
|
Torch-npu |
torch-npu、torch |
|
mindstudio |
mindstudio |
- |