1、CANN与Ascend HDK版本配套关系
2、 CANN组合包版本配套关系
3、 CANN独立升级子包版本配套关系
4、CANN开源子包版本配套关系
- 低bit类算子和融合算子支持更多数据类型:fp8/mxfp8/hifp8/mxfp4等,并支持pertensor/perchannel/pertoken/pergroup/perblock等不同量化和组合方式:
- 提供matmul、卷积、norm和hash类算子编程的优秀实践:
- 新增<<<>>>的算子开发样例()。
- 支持编译生成静态库,发布的nn独立组件包携带静态库()。
- 集合通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品支持alltoallv算子aicpu展开模式通信task缓存功能()。
- 集合通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品支持单机多容器部署。
- 集合通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品支持通信域粒度的超平面QoS配置()。
- 集合通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品支持aicpu&host 自定义算子场景的profiling信息上报能力,提升自定义通信算子的维测能力( )。
- 集合通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品AICPU自定义算子场景支持host和aicpu间的kernel同步()。
- 单边通信: Atlas A3 训练系列产品/Atlas A3 推理系列产品超节点内HCCS场景下支持D2rH直传能力(本端device内存与远端host内存通信能力)()。
- ES构图提供多种场景的sample( 、)。
- ES构图Readable Dump支持子图的友好展示。
- 自定义pass改图能力增强,新增原图优化之后改图的能力。
- 图模式多流场景nopadding连续内存支持内存复用。
提供包版本号查询接口,根据包名查询返回数值版本号和字符串版本号,接口如下:
支持查询指定流(Stream)的优先级,接口如下:
支持查询创建Stream时设置的flag标志,接口如下:
支持获取Device的唯一标识UUID(Universally Unique Identifier),接口如下:
支持获取待查询地址所属内存块的起始地址以及内存块大小,接口如下:
支持设置和查询强一致性计算的参数,相关接口如下:
不涉及。
无。
- 集合通信:优化快恢时的状态迁移及超时机制,解决快恢失败的问题。
- 集合通信:修复了大规模集群的通信域初始化失败问题(在rootinfo集群信息收集阶段)。
子包独立升级提供了灵活的按需升级功能。
使用场景举例:某用户已安装了a.b.c版本的组合包Ascend-cann-toolkit和Ascend-cann-ops,由于业务需要,要求将单边通信库能力更新至x.y.z版本,此时,可通过独立升级子包cann-hixl来实现。其中a.b.c和x.y.z请替换为实际版本号。
升级子包前,请确保已安装配套版本的组合包Ascend-cann-toolkit和Ascend-cann-ops。如未安装,请参考《》进行安装。
子包的升级路径应与组合包的安装路径保持一致。所有子包的升级操作相同,以下以升级 cann-hixl_x.y.z_linux-aarch64.run 为例进行说明。
升级场景一:
组合包Ascend-cann-toolkit和Ascend-cann-ops安装在默认路径下(即安装时未使用“--install-path”参数)
升级场景二:
组合包Ascend-cann-toolkit和Ascend-cann-ops安装在指定路径“/home/custom_path”(即安装时指定“--install-path=/home/custom_path”)