MindIE-RT总体架构分为三层:图构建、图优化、运行时。在多种主流深度学习框架上完成训练的模型,可直接导入作为推理部署的基础,整体如图1所示,关键模块详见表1。
图1 MindIE-RT总体架构图
表1 架构图模块介绍
模块 |
说明 |
图构建 |
- 图构建部分核心任务为计算图Graph的生成,可以通过针对不同框架的Parser导入或手动构建。
- 提供计算图结构增删改API。
- 提供自定义算子(Custom Operator)注册入口。
|
图优化 |
- 图优化部分核心任务为对计算图的多层次编译优化,提高推理性能。
- 提供自定义Pass注册入口。
|
运行时 |
运行时提供了运行模型对象的接口以及运行环境。主要支持了以下功能:
- 能够脱离builder编译引擎独立部署。
- 支持模型推理结果的内存复用。
- 支持多任务队列的发射,并发执行。
|