开发者
资源

新增特性

组件

描述

目的

Ascend Extension for PyTorch(即torch-npu)

内存快照支持获取aarch64架构的C++调用栈

提高内存快照获取信息的完整性。

支持aclgraph

显著降低CPU开销,优化下发耗时。

说明:

该功能暂时只支持推理,不支持训练。

新增支持PyTorch 2.6.0

通用能力,与社区同步发布。

支持申请swap_tensor

由host直接申请内存,降低device内存压力。

Parallel Store增强

优化TCP Store性能。

Flight Recorder支持PyTorch 2.6.0版本

增加通信算子timeout时间和pg_status信息记录。

环境变量“P2P_HCCL_BUFFSIZE”变更

默认值变更为20,具体影响可参见《环境变量参考》中的“P2P_HCCL_BUFFSIZE”章节。

Driving SDK

MapTR模型优化

提升昇腾自动驾驶模型支持度,适配业界主流感知算法。

Deformable DETR模型优化

新增FlashOcc模型

新增SparseDrive模型

提升昇腾自动驾驶模型支持度,适配业界主流端到端自动驾驶算法。