昇腾社区首页
中文
注册
开源生态推理引擎
vLLM Ascend是用于在昇腾NPU上高效运行vLLM推理框架的硬件适配插件,实现了昇腾NPU与vLLM框架的无缝对接。借助MindIE Turbo昇腾通用加速套件可在昇腾NPU上实现高效大语言模型推理支持,达到更大的吞吐、更低的时延
MindIE推理引擎
MindIE是基于昇腾硬件的运行加速、调试调优、快速迁移部署的高性能AI推理引擎,分层开放满足各类需求,统一接口使能极简开发,沉淀能力构筑极致性能
客户推理引擎
支持客户自定义推理引擎对接昇腾CANN,开放接口与加速库,兼容灵活架构设计,确保高性能与稳定部署
MindIE
推理引擎
推理服务
推理模型套件
加速套件
MindIE Service 昇腾推理服务
MindIE SD
MindIE LLM
MindIE Turbo 昇腾通用加速套件
可选
第三方加速引擎(vLLM I …)
AI 框架
MindSpore 昇思
PyTorch
硬件使能
CANN 异构计算架构
MindStudio
全流程工具链

开发资源

安装资源
开源生态推理引擎资源获取
通过Dockfile文件构建镜像,准备具体模型运行所需的基础环境,包括CANNFrameworkPTAdapter、MindIE Turbo、vLLM和vLLM Ascend,可实现模型快速上手推理,镜像制作可以参考“镜像制作指导
MindIE推理引擎镜像获取
该镜像已具备模型运行所需的基础环境,包括:CANNFrameworkPTAdapterMindIE与ATB Models,可实现模型快速上手推理
模型列表
vLLM Ascend大语言模型支持列表
vLLM Ascend支持的大语言模型及版本
已支持:
DeepSeek
Qwen
LLaMa
InternLM
Baichuan
...
MindIE大语言模型支持列表
MindIE支持的大语言模型及版本
已支持:
DeepSeek
Qwen
LLaMa
ChatGLM
Baichuan
...

拓展资源

ModelZoo
满足商用标准的一站式昇腾大模型服务平台
魔乐社区
提供丰富的资源,涵盖AI模型推理、优化和应用的最佳实践
vLLM Ascend
昇腾通过vLLM Ascend插件适配vLLM开源框架
昇腾学习
打造人工智能学习平台,做你的技术加油站
博客
技术沉淀,经验分享,记录思考与成长