MindIE Service 昇腾推理服务
MindIE Service是昇腾MindIE的服务化组件,提供了服务化API接口的能力,并适配了第三方TGI、Triton等API接口规范,同时提供了批处理、任务调度等能力
了解 MindIE ServiceMindIE LLM
MindIE LLM是大语言模型加速套件,不仅支持对接MindIE Service,也支持对接第三方的服务化框架,如TGI、vLLM和Triton,在内存、通信、编解码等层面上提供了内存压缩,解码优化,混合并行加速等一系列加速技术,可以实现更大吞吐、更低时延
了解 MindIE LLMMindIE Turbo 推理模型加速库
MindIE Turbo是昇腾为所有推理引擎提供的通用昇腾硬件加速套件,在内存、通信、编解码等层面上提供加速,达到更大的吞吐、更低的时延。目前首发版本支持了vLLM的加速,其他引擎加速敬请期待
了解 MindIE Turbo