MindIE(Mind Inference Engine,昇腾推理引擎)是华为昇腾针对AI全场景业务的推理加速套件。通过分层开放AI能力,支撑用户多样化的AI业务需求,使能百模千态,释放昇腾硬件设备算力。向上支持多种主流AI框架,向下对接不同类型昇腾AI处理器,提供多层次编程接口,帮助用户快速构建基于昇腾平台的推理业务。
MindIE提供了基于多种AI场景下的推理解决方案,具有强大的性能、健全的生态,帮助用户快速开展业务迁移、业务定制。MindIE架构图如所示,主要组件介绍如所示。
图 1 昇腾推理引擎架构图[object Object][object Object]
表 1 组件介绍[object Object][object Object]
服务化部署
MindIE Motor提供用户侧接口、调度优化、多模型业务串流等能力。提供模型管理,DevOps等服务化调度能力。
多模态生成
MindIE SD支持模型迁移推理,高效实现应用部署,场景化落地SD应用,满足客户精度及性能要求。
大模型推理
MindIE LLM提供大模型推理能力,支持大模型业务全流程,逐级能力开放,使能大模型客户需求定制化。