推理应用接口软件架构 MindIE-RT总体架构分为三层:图构建、图优化、运行时。在多种主流深度学习框架上完成训练的模型,可直接导入作为推理部署的基础,整体如图1所示,关键模块详见表1。 图1 MindIE-RT总体架构图 表1 架构图模块介绍 模块 说明 图构建 图构建部分核心任务为计算图Graph的生成,可以通过针对不同框架的Parser导入或手动构建。 提供计算图结构增删改API。 提供自定义算子(Custom Operator)注册入口。 图优化 图优化部分核心任务为对计算图的多层次编译优化,提高推理性能。 提供自定义Pass注册入口。 运行时 运行时提供了运行模型对象的接口以及运行环境。主要支持了以下功能: 能够脱离builder编译引擎独立部署。 支持模型推理结果的内存复用。 支持多任务队列的发射,并发执行。 父主题: 推理应用接口使用