Ascend Extension for PyTorch是什么
Ascend Extension for PyTorch插件是基于昇腾的深度学习适配框架,使昇腾NPU可以支持PyTorch框架,为PyTorch框架的使用者提供昇腾AI处理器的超强算力。
昇腾为基于昇腾处理器和软件的行业应用及服务提供全栈AI计算基础设施。您可以通过访问昇腾社区,了解关于昇腾的更多信息。
总体架构
Ascend Extension for PyTorch整体架构如下所示。
图1 Ascend Extension for PyTorch整体架构


- MindSpeed LLM:LLM模型套件,提供LLM大模型端到端训练流程,提供模型结构增强、微调、偏好对齐、数据工程能力,覆盖业内主流语言大模型。
- MindSpeed MM:多模态模型套件,聚焦多模态生成、多模态理解,提供大模多模态大模型端到端训练流程,提供多模数据预处理、编码、融合、训练微调等能力,覆盖业内主流多模态大模型。
- MindSpeed Core:昇腾加速库,提供计算、显存、通信、并行四个维度的优化,支持长序列、MoE等关键特性的性能加速。
- Ascend Extension for PyTorch(即torch_npu插件):昇腾PyTorch适配插件,继承开源PyTorch特性,针对昇腾AI处理器系列进行深度优化,支持用户基于PyTorch框架实现模型训练和调优。
- PyTorch原生库/三方库适配:适配支持PyTorch原生库及主流三方库,补齐生态能力,提高昇腾平台易用性。
关键功能特性
- 适配昇腾AI处理器:基于开源PyTorch,适配昇腾AI处理器,提供原生Python接口。
- 框架基础功能:PyTorch动态图、自动微分、Profiling、优化器等。
- 自定义算子开发:支持在PyTorch框架中添加自定义算子。
- 分布式训练:支持原生分布式数据并行训练,包含单机多卡、多机多卡场景支持的集合通信原语包含Broadcast、AllReduce等。
- 模型推理:支持输出标准的ONNX模型可通过离线转换工具将ONNX模型转换为离线推理模型。