新增特性
组件 |
描述 |
目的 |
---|---|---|
Ascend Extension for PyTorch(即torch-npu) |
内存快照支持获取aarch64架构的C++调用栈 |
提高内存快照获取信息的完整性。 |
支持aclgraph |
显著降低CPU开销,优化下发耗时。 说明:
该功能暂时只支持推理,不支持训练。 |
|
新增支持PyTorch 2.6.0 |
通用能力,与社区同步发布。 |
|
支持申请swap_tensor |
由host直接申请内存,降低device内存压力。 |
|
Parallel Store增强 |
优化TCP Store性能。 |
|
flight recorder支持PyTorch 2.6.0版本 |
增加通信算子timeout时间和pg_status信息记录。 |
|
环境变量“P2P_HCCL_BUFFSIZE”变更 |
||
Driving SDK |
MapTR模型优化 |
提升昇腾自动驾驶模型支持度,适配业界主流感知算法。 |
Deformable DETR模型优化 |
||
新增FlashOcc模型 |
||
新增SparseDrive模型 |
提升昇腾自动驾驶模型支持度,适配业界主流端到端自动驾驶算法。 |
|
openMind |
新增微调训练方式支持 |
新增支持PISSA低参微调、LLM的DPO算法、Reward模型训练、Open-R1多机训练。 |
新增模型支持 |
新增支持Qwen2-VL、Qwen3系列模型。 |
|
新增多社区下载支持 |
新增环境变量OPENMIND_PLATFORM,支持从第三方社区HuggingFace下载模型资源。 |
|
新增支持Python 3.11 |
通用能力。 |
|
新增支持PyTorch 2.6.0 |
通用能力,与社区同步发布。 |
父主题: 7.1.0更新说明