昇腾社区首页
中文
注册

框架选型

针对大语言模型推理,MindIE当前有三条推理框架组合方案的路线可供选择,三者都需要经过MindIE LLMATB Models模块,三条路线各有优劣势,具体可以根据用户使用场景选择。

图1 路线框架图
表1 路线介绍说明

路线

典型场景

链接

路线1:MindIE Service + MindIE LLM + PyTorch

极致性能:在MindIE Service接口能够满足需求时,要求极致性能,推荐此路线。

请参见《MindIE Service开发指南》的“产品简介”章节

路线2:vLLM+ MindIE LLM + PyTorch

接口丰富:用户AI应用,要求服务化接口功能齐全,推荐此路线。

请参见《MindIE LLM开发指南》的“服务化调度推理使用流程 > vLLM基于Text Generator接口开发指南 > 快速介绍”章节

路线3:MindIE Service + MindIE LLM + MindSpore

全栈可控:用户对于自主可控的诉求强烈,推荐此路线。

请参见《MindIE LLM开发指南》的“模型推理使用流程 > MindSpore Models使用 > MindSpore Models服务化使用”章节