昇腾社区首页
中文
注册

新增特性

组件

描述

目的

Ascend Extension for PyTorch(即torch-npu)

内存快照支持获取aarch64架构的C++调用栈

提高内存快照获取信息的完整性。

支持aclgraph

显著降低CPU开销,优化下发耗时。

说明:

该功能暂时只支持推理,不支持训练。

新增支持PyTorch 2.6.0

通用能力,与社区同步发布。

支持申请swap_tensor

由host直接申请内存,降低device内存压力。

Parallel Store增强

优化TCP Store性能。

flight recorder支持PyTorch 2.6.0版本

增加通信算子timeout时间和pg_status信息记录。

环境变量“P2P_HCCL_BUFFSIZE”变更

默认值变更为20,单位MB,具体影响可参见《环境变量参考》中的“P2P_HCCL_BUFFSIZE”章节

Driving SDK

MapTR模型优化

提升昇腾自动驾驶模型支持度,适配业界主流感知算法。

Deformable DETR模型优化

新增FlashOcc模型

新增SparseDrive模型

提升昇腾自动驾驶模型支持度,适配业界主流端到端自动驾驶算法。

openMind

新增微调训练方式支持

新增支持PISSA低参微调、LLM的DPO算法、Reward模型训练、Open-R1多机训练。

新增模型支持

新增支持Qwen2-VL、Qwen3系列模型。

新增多社区下载支持

新增环境变量OPENMIND_PLATFORM,支持从第三方社区HuggingFace下载模型资源。

新增支持Python 3.11

通用能力。

新增支持PyTorch 2.6.0

通用能力,与社区同步发布。