推理应用接口软件架构

MindIE-RT总体架构分为三层:图构建、图优化、运行时。在多种主流深度学习框架上完成训练的模型,可直接导入作为推理部署的基础,整体如图1所示,关键模块详见表1

图1 MindIE-RT总体架构图
表1 架构图模块介绍

模块

说明

图构建

  • 图构建部分核心任务为计算图Graph的生成,可以通过针对不同框架的Parser导入或手动构建。
  • 提供计算图结构增删改API。
  • 提供自定义算子(Custom Operator)注册入口。

图优化

  • 图优化部分核心任务为对计算图的多层次编译优化,提高推理性能。
  • 提供自定义Pass注册入口。

运行时

运行时提供了运行模型对象的接口以及运行环境。主要支持了以下功能:

  • 能够脱离builder编译引擎独立部署。
  • 支持模型推理结果的内存复用。
  • 支持多任务队列的发射,并发执行。