开发应用时,如果涉及整网模型推理,则应用程序中必须包含模型加载的代码逻辑,关于模型加载的接口调用流程,请依次参见主要接口调用流程以及本节中的说明。
本节描述的是整网模型加载的接口调用流程,对于算子模型加载与执行的接口调用流程请参见算子调用。
图1 模型加载流程-使用不同的模型加载接口
图2 模型加载流程-使用相同的模型加载接口
关键接口的说明如下(调用示例请参见模型加载):
- 在模型加载前,需要先构建出适配昇腾AI处理器的离线模型(*.om文件),构建方式请参见模型构建。
- 当由用户管理内存时,为确保内存不浪费,在申请工作内存、权值内存前,需要调用aclmdlQuerySize接口查询模型运行时所需工作内存、权值内存的大小。
- 支持以下方式加载模型,模型加载成功后,返回标识模型的模型ID: