昇腾社区首页
中文
注册

获取软件包

获取相应的软件可参见下载软件包;获取相应软件包的源码可参见开源组件源码进行操作。部分组件软件包请参考表1获取并通过软件sum值验证;部分组件软件包请参考表2获取并通过软件数字签名验证。

下载软件包

下载本软件即表示您同意华为企业业务最终用户许可协议(EULA)的条款和条件。

{version}表示软件版本号,{arch}表示CPU架构。

表1 各组件软件包(通过sum值验证)

组件名称

包内文件列表

说明

获取链接

Ascend Docker Runtime

ascend-docker-cli

Ascend Docker Runtime运行所必需的可执行程序,不建议用户直接运行。

获取链接

ascend-docker-destroy

ascend-docker-hook

ascend-docker-plugin-install-helper

ascend-docker-runtime

assets

说明资料的图片资源。

base.list*

默认的挂载列表,安装时,程序会根据install-type,安装不同的挂载列表。

run_main.sh

安装脚本,不建议用户直接使用。

uninstall.sh

卸载脚本,不建议用户直接使用。

README.md

Ascend Docker Runtime说明资料,包含设计原理。

NPU Exporter

npu-exporter

NPU Exporter二进制文件。

获取链接

Dockerfile

NPU Exporter镜像构建文本文件。

Dockerfile-310P-1usoc

Atlas 200I SoC A1 核心板NPU Exporter镜像构建文本文件。

run_for_310P_1usoc.sh

Atlas 200I SoC A1 核心板NPU Exporter镜像中启动组件的脚本。

npu-exporter-v{version}.yaml

NPU Exporter的启动配置文件。

npu-exporter-310P-1usoc-v{version}.yaml

Atlas 200I SoC A1 核心板NPU Exporter的启动配置文件。

Ascend Device Plugin

device-plugin

Ascend Device Plugin二进制文件。

获取链接

Dockerfile

Ascend Device Plugin镜像构建文本文件。

Dockerfile-310P-1usoc

Atlas 200I SoC A1 核心板Ascend Device Plugin镜像构建文本文件。

run_for_310P_1usoc.sh

Atlas 200I SoC A1 核心板Ascend Device Plugin镜像中启动组件的脚本。

faultCode.json

记录芯片故障码与其故障恢复方式的对应关系。

须知:

系统配置文件,请勿随意修改,否则可能会导致系统故障处理功能出错。

SwitchFaultCode.json

记录总线设备故障码与其故障恢复方式的对应关系。

须知:

系统配置文件,请勿随意修改,否则可能会导致系统故障处理功能出错。

faultCustomization.json

芯片故障频率及时长默认配置文件。

须知:

系统配置文件,请勿随意修改,否则可能会导致系统故障处理功能出错。

device-plugin-310-v{version}.yaml

推理服务器(插Atlas 300I 推理卡)上不使用Volcano的配置文件。

device-plugin-310-volcano-v{version}.yaml

推理服务器(插Atlas 300I 推理卡)上使用Volcano的配置文件。

device-plugin-310P-v{version}.yaml

Atlas 推理系列产品设备上不使用Volcano的配置文件。

device-plugin-310P-volcano-v{version}.yaml

Atlas 推理系列产品设备上使用Volcano的配置文件。

device-plugin-310P-1usoc-v{version}.yaml

Atlas 200I SoC A1 核心板上不使用Volcano的配置文件。

device-plugin-310P-1usoc-volcano-v{version}.yaml

Atlas 200I SoC A1 核心板上使用Volcano的配置文件。

device-plugin-910-v{version}.yaml

Atlas 训练系列产品Atlas A2 训练系列产品上不使用Volcano的配置文件。

device-plugin-volcano-v{version}.yaml

Atlas 训练系列产品Atlas A2 训练系列产品上使用Volcano的配置文件。

Volcano

volcano-npu_{version}_linux-{arch}.so

Volcano华为NPU调度插件动态链接库。

获取链接

Dockerfile-scheduler

Volcano scheduler镜像构建文本文件。

Dockerfile-controller

Volcano controller镜像构建文本文件。

volcano-v{version}.yaml

Volcano的启动配置文件。

vc-scheduler

volcano-scheduler组件二进制文件。

vc-controller-manager

volcano-controller组件二进制文件。

说明:

请根据K8s和开源Volcano的兼容性选择合适的版本进行安装。

  • Volcano v1.7.0兼容的K8s版本范围为1.19.x~1.28.x。
  • Volcano v1.9.0兼容的K8s版本范围为1.21.x~1.28.x。

Ascend Operator

ascend-operator

Ascend Operator二进制文件。

获取链接

Dockerfile

Ascend Operator镜像构建文本文件。

ascend-operator-v{version}.yaml

Ascend Operator的启动配置文件。

NodeD

noded

NodeD二进制文件。

获取链接

noded-v{version}.yaml

NodeD的启动配置文件。

NodeDConfiguration.json

记录节点硬件故障码与其故障恢复方式的对应关系。

pingmesh-config.yaml

pingmesh配置文件。

Dockerfile

NodeD镜像构建文本文件。

ClusterD

clusterd

ClusterD二进制文件。

获取链接

clusterd-v{version}.yaml

ClusterD的启动配置文件。

Dockerfile

ClusterD镜像构建文本文件。

faultDuration.json

关联故障处理时长配置文件。

relationFaultCustomization.json

关联故障处理策略配置文件。

publicFaultConfiguration.json

公共故障配置文件。

TaskD

taskd-{version}-py3-none-linux_{arch}.whl

断点续训特性二进制文件。

获取链接

软件SUM值验证

为了防止软件包在传递过程中或存储期间被恶意篡改,下载软件包时需下载对应的完整性校验文件用于完整性验证。校验方式参考如下,以ClusterD进行软件SUM值验证为例;SUM文件中的值请以实际情况为准。

  1. 将下载的软件包以及对应的完整性校验文件上传到Linux服务器,如“/home/ascend-clusterd”目录下。
  2. 进入“/home”目录,执行如下操作从sum文件中读取对应架构的软件包的SUM值。
    cat /home/Ascend-mindxdl-clusterd_{version}_linux-x86_64.zip.sha256sum

    回显示例如下。

    1
    1521a347b1aa30e0d31dbc86cd7803d7bae483e08422c3c96f9a00db011d10b8
    
  3. 将上一步读取的SUM值与对应架构的软件包的名字按照下面的示例构造命令,然后回车执行。
    echo "1521a347b1aa30e0d31dbc86cd7803d7bae483e08422c3c96f9a00db011d10b8 Ascend-mindxdl-clusterd_{version}_linux-x86_64.zip" | sha256sum --check

    回显示例如下则表示校验成功,软件包没有被篡改过,该软件包可以正常使用。

    1
    Ascend-mindxdl-clusterd_{version}_linux-x86_64.zip: OK
    
表2 各组件软件包(通过数字签名验证)

组件名称

包内文件列表

说明

获取链接

Resilience Controller

resilience-controller

Resilience Controller二进制文件。

获取链接

cert-importer

证书导入工具二进制文件。

Dockerfile

Resilience Controller镜像构建文本文件。

resilience-controller-v{version}.yaml

Resilience Controller的启动配置文件(不需要用户导入KubeConfig文件)。

resilience-controller-without-token-v{version}.yaml

Resilience Controller的启动配置文件(需要用户导入KubeConfig文件)。

lib

加密组件依赖的动态库文件。

Elastic Agent

mindx_elastic-{version}.-py3-none-linux_{arch}.whl

断点续训特性二进制文件。

获取链接

{version}表示软件版本号,{arch}表示CPU架构。

软件数字签名验证

为了防止软件包在传递过程中或存储期间被恶意篡改,下载软件包时需下载对应的数字签名文件用于完整性验证。

在软件包下载之后,请参考《OpenPGP签名验证指南》,对从Support网站下载的软件包进行PGP数字签名校验。如果校验失败,请不要使用该软件包,先联系华为技术支持工程师解决。

使用软件包安装/升级之前,也需要按上述过程先验证软件包的数字签名,确保软件包未被篡改。

运营商客户请访问:https://support.huawei.com/carrier/digitalSignatureAction

企业客户请访问:https://support.huawei.com/enterprise/zh/tool/pgp-verify-TL1000000054

开源组件源码