动态分辨率
基本原理
- 若模型推理时包含动态分辨率特性,在模型推理时,需调用pyACL提供的接口设置模型推理时需使用的分辨率,完整流程请参见基本概念。关键接口的调用流程如下:
- 加载模型。模型加载的详细流程,请参见模型加载,模型加载成功后,返回标识模型的ID。
对于动态分辨率,模型支持的分辨率已提前在构建模型时配置(构建模型的说明请参见《ATC工具使用指南》),构建模型成功后,在生成的om模型中,会新增一个输入(下文简称动态分辨率输入),在模型推理时通过该新增的输入提供具体的分辨率。
例如,a输入的Batch数是动态的,在om模型中,会有与a对应的b输入来描述a的Batch数。在模型执行时,准备a输入的数据结构请参见准备模型推理的输入/输出数据,准备b输入的数据结构、设置b输入的数据请依次参见2、3。
加载模型数据分为以下4种方式:- acl.mdl.load_from_file:从文件加载离线模型数据,由系统内部管理内存。
- acl.mdl.load_from_mem:从内存加载离线模型数据,由系统内部管理内存。
- acl.mdl.load_from_file_with_mem:从文件加载离线模型数据,由用户自行管理模型运行的内存(包括工作内存和权值内存)。
- acl.mdl.load_from_mem_with_mem:从内存加载离线模型数据,由用户自行管理模型运行的内存(包括工作内存和权值内存)。
- 加载模型。模型加载的详细流程,请参见模型加载,模型加载成功后,返回标识模型的ID。
- 创建aclmdlDataset类型的数据,用于描述模型的输入数据、输出数据。
- 调用acl.create_data_buffer接口创建aclDataBuffer类型的数据,用于存放输入/输出数据的内存地址、内存大小,内存需提前调用acl.rt.malloc接口申请。
申请动态分辨率输入对应的内存前,需要先调用acl.mdl.get_input_index_by_name接口根据输入名称(固定为"ascend_mbatch_shape_data")获取模型中标识动态分辨率输入的index,再调用acl.mdl.get_input_size_by_index、acl.mdl.get_output_size_by_index接口根据index获取输入、输出内存大小。申请动态分辨率输入对应的内存后,无需用户设置内存中的数据(否则可能会导致业务异常),用户调用3.b中的接口后,系统会自动向内存中填入数据。
- 调用acl.mdl.create_dataset接口创建aclmdlDataset类型的数据,并调用acl.mdl.add_dataset_buffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
- 调用acl.create_data_buffer接口创建aclDataBuffer类型的数据,用于存放输入/输出数据的内存地址、内存大小,内存需提前调用acl.rt.malloc接口申请。
- 在成功加载模型之后,执行模型之前,设置动态分辨率(模型的输入图片的宽和高)。
- 根据输入名称(固定为"ascend_mbatch_shape_data"),获取模型中标识动态分辨率输入的index。
- 调用acl.mdl.set_dynamic_hw_size接口设置动态分辨率。
此处设置的分辨率只能是模型转换时通过dynamic_image_size参数设置的分辨率档位中的某一个,模型转换的详细说明请参见《ATC工具使用指南》。
也可以调用acl.mdl.get_dynamic_hw接口获取指定模型支持的分辨率档位数以及每一档中的宽、高。
- 执行模型。
调用acl.mdl.execute接口执行模型。

- 对同一个模型,不能同时调用acl.mdl.set_dynamic_batch_size接口和acl.mdl.set_dynamic_hw_size接口。
- 申请动态分辨率的输出的内存,当前只支持申请最大分辨率的内存,建议直接调用acl.mdl.get_output_size_by_index接口获取。
- 动态AIPP和动态分辨率同时使用时:
- 若在设置动态AIPP参数时,开启了抠图或缩放或补边功能,则不能与动态分辨率同时使用。
- 若在设置动态AIPP参数时,未开启抠图或缩放或补边功能,在与动态分辨率同时使用时,需确保通过acl.mdl.set_aipp_src_image_size接口设置的宽、高与通过acl.mdl.set_dynamic_hw_size接口设置的宽、高相等,都必须设置成模型转换时动态分辨率最大档位的宽、高。
- 模型中需要进行动态AIPP处理的data节点,其对应的输入内存大小需按照最大分辨率(宽、高)来申请。
示例代码
调用接口后,需增加异常处理的分支,并记录报错日志、提示日志,此处不一一列举。以下是关键步骤的代码示例,不可以直接拷贝运行,仅供参考。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 |
# 1.模型加载,加载成功后,再设置动态分辨率 # ...... # 2.创建aclmdlDataset类型的数据,用于描述模型的输入数据input、输出数据output # ...... # 3.自定义函数,设置动态分辨率 def model_set_dynamicInfo(): # 2.1 获取动态分辨率输入的index,标识动态分辨率输入的输入名称固定为"ascend_mbatch_shape_data" index, ret = acl.mdl.get_input_index_by_name(modelDesc, "ascend_mbatch_shape_data") # 2.2 设置输入图片分辨率,model_id表示加载成功的模型的ID,input表示aclmdlDataset类型的数据,index表示标识动态分辨率输入的输入index height = 224 width = 224 ret = acl.mdl.set_dynamic_hw_size(model_id, input, index, height, width) # ...... # 4.自定义函数,执行模型 def model_execute(index): # 4.1 调用自定义函数,设置动态分辨率 ret = model_set_dynamicInfo() # 4.2 执行模型,model_id表示加载成功的模型的ID,input和output分别表示模型的输入和输出 ret = acl.mdl.execute(model_id, input, output) # ...... # 5.处理模型推理结果 # ...... |
父主题: 模型推理扩展场景