基本原理

若模型推理时包含动态Batch特性，在模型推理时，需调用pyACL提供的接口设置模型推理时需使用的Batch数，完整流程请参见模型执行。关键接口的调用流程如下：
1. 加载模型。模型加载的详细流程，请参见模型加载，模型加载成功后，返回标识模型的ID。
  对于动态Batch，模型支持的Batch数已提前在构建模型时配置（构建模型的说明请参见《ATC工具使用指南》），构建模型成功后，在生成的om模型中，会新增一个输入（下文简称动态Batch输入），在模型推理时通过该新增的输入提供具体的Batch值。
  
  例如，a输入的Batch数是动态的，在om模型中，会有与a对应的b输入来描述a的Batch数。在模型执行时，准备a输入的数据结构请参见准备模型推理的输入/输出数据，准备b输入的数据结构、设置b输入的数据请依次参见2、3。
加载模型数据分为以下4种方式：
- acl.mdl.load_from_file：从文件加载离线模型数据，由系统内部管理内存。
- acl.mdl.load_from_mem：从内存加载离线模型数据，由系统内部管理内存。
- acl.mdl.load_from_file_with_mem：从文件加载离线模型数据，由用户自行管理模型运行的内存（包括工作内存和权值内存）。
- acl.mdl.load_from_mem_with_mem：从内存加载离线模型数据，由用户自行管理模型运行的内存（包括工作内存和权值内存）。
创建aclmdlDataset类型的数据，用于描述模型的输入数据、输出数据。
1. 调用acl.create_data_buffer接口创建aclDataBuffer类型的数据，用于存放输入/输出数据的内存地址、内存大小，内存需提前调用acl.rt.malloc接口申请。
  申请动态Batch输入对应的内存前，需要先调用acl.mdl.get_input_index_by_name接口根据输入名称（固定为"ascend_mbatch_shape_data"）获取模型中标识动态Batch输入的index，再调用acl.mdl.get_input_size_by_index、acl.mdl.get_output_size_by_index接口根据index获取输入、输出内存大小。申请动态Batch输入对应的内存后，无需用户设置内存中的数据（否则可能会导致业务异常），用户调用3.b中的接口后，系统会自动向内存中填入数据。
2. 调用acl.mdl.create_dataset接口创建aclmdlDataset类型的数据，并调用acl.mdl.add_dataset_buffer接口向aclmdlDataset类型的数据中增加aclDataBuffer类型的数据。
在成功加载模型之后，执行模型之前，设置动态Batch数。
1. 调用acl.mdl.get_input_index_by_name接口根据输入名称（固定为"ascend_mbatch_shape_data"）获取模型中标识动态Batch输入的index。
2. 调用acl.mdl.set_dynamic_batch_size接口设置动态Batch数。
  此处设置的Batch数只能是模型转换时通过dynamic_batch_size参数设置的Batch档位中的某一个，模型转换的详细说明请参见《ATC工具使用指南》。
  
  也可以调用acl.mdl.get_dynamic_batch接口获取指定模型支持的Batch档位数以及每一档中的Batch数。
执行模型。
调用acl.mdl.execute接口执行模型。

对同一个模型，不能同时调用acl.mdl.set_dynamic_batch_size接口和acl.mdl.set_dynamic_hw_size接口。
申请动态Batch输出的内存，当前只支持申请最大档位的内存，建议直接调用acl.mdl.get_output_size_by_index接口获取。
动态AIPP和动态Batch同时使用时：
- 调用acl.mdl.create_aipp接口设置batch_size时，batch_size要设置为最大Batch数。
- 模型中需要进行动态AIPP处理的data节点，其对应的输入内存大小需按照最大Batch来申请。

示例代码

调用接口后，需增加异常处理的分支，并记录报错日志、提示日志，此处不一一列举。以下是关键步骤的代码示例，不可以直接拷贝运行，仅供参考。

      
       
         
         
           # 1.模型加载，加载成功后，再设置动态Batch
# ......

# 2.创建aclmdlDataset类型的数据，用于描述模型的输入数据input、输出数据output
# ......

# 3.自定义函数，设置动态Batch
def model_set_dynamicinfo():
    # 2.1 获取动态Batch输入的index，标识动态Batch输入的输入名称固定为"ascend_mbatch_shape_data"
    index, ret = acl.mdl.get_input_index_by_name(model_desc, "ascend_mbatch_shape_data")
    # 2.2 设置Batch，model_id表示加载成功的模型的ID，input表示aclmdlDataset类型的数据，index表示标识动态Batch输入的输入index
    batchSize = 8
    ret = acl.mdl.set_dynamic_batch_size(model_id_, input, index, batch_size)
    # ......

# 4.自定义函数，执行模型
def model_execute(index):
    # 4.1 调用自定义函数，设置动态Batch
    ret = model_set_dynamicinfo()
    # 4.2 执行模型，model_id表示加载成功的模型的ID，input和output分别表示模型的输入和输出
    ret = acl.mdl.execute(model_id, input, output)
    # ......
}

# 5.处理模型推理结果
# ......