aclmdlBundleLoadModelWithMem

产品支持情况

产品	是否支持
Atlas A3 训练系列产品 / Atlas A3 推理系列产品	√
Atlas A2 训练系列产品 / Atlas A2 推理系列产品	√
Atlas 200I/500 A2 推理产品	√
Atlas 推理系列产品	√
Atlas 训练系列产品	√

功能说明

根据图索引加载模型中的图，由用户自行管理模型运行的内存。

函数原型

aclError aclmdlBundleLoadModelWithMem(uint32_t bundleId, size_t index, void *workPtr, size_t workSize, void *weightPtr, size_t weightSize, uint32_t *modelId)

参数说明

参数名	输入/输出	说明
bundleId	输入	通过aclmdlBundleInitFromFile或者aclmdlBundleInitFromMem接口初始化模型成功后返回的bundleId。
index	输入	索引。用户调用aclmdlBundleGetQueryModelNum接口获取图总数后，这个index的取值范围：[0, (图总数-1)]。
workPtr	输入	Device上模型所需工作内存（存放模型执行过程中的临时数据）的地址指针，由用户自行管理，模型执行过程中不能释放该内存。如果在workPtr参数处传入空指针，表示由系统管理内存。由用户自行管理工作内存时，如果多个模型串行执行，支持共用同一个工作内存，但用户需确保模型的串行执行顺序、且工作内存的大小需按多个模型中最大工作内存的大小来申请，例如通过以下方式保证串行：同步模型执行时，加锁，保证执行任务串行。异步模型执行时，使用同一个stream，保证执行任务串行。
workSize	输入	模型所需工作内存的大小，单位Byte。workPtr为空指针时无效。
weightPtr	输入	Device上模型权值内存（存放权值数据）的地址指针，由用户自行管理，模型执行过程中不能释放该内存。如果在weightPtr参数处传入空指针，表示由系统管理内存。由用户自行管理权值内存时，在多线程场景下，对于同一个模型，如果在每个线程中都加载了一次，支持共用weightPtr，因为weightPtr内存在推理过程中是只读的。此处需注意，在共用weightPtr期间，不能释放weightPtr。
weightSize	输入	模型所需权值内存的大小，单位Byte。weightPtr为空指针时无效。
modelId	输出	实际可执行的图ID。

返回值说明

返回0表示成功，返回其他值表示失败，请参见aclError。

参考资源

接口调用流程及示例代码请参见权重更新（由用户管理内存）。

父主题： 模型加载和卸载