昇腾社区首页
中文
注册

概念及使用约束

相关概念

表1 概念介绍

概念

描述

动态batch/动态分辨率

在某些场景下,模型每次输入的batch size或分辨率是不固定的,如检测出目标后再执行目标识别网络,由于目标个数不固定导致目标识别网络输入batch size不固定。

  • 动态batch:用户执行推理时,其batch size是动态可变的。
  • 动态分辨率:用户执行推理时,每张图片的分辨率H * W是动态可变的。

动态维度(ND格式)

为了支持Transformer等网络在输入格式的维度不确定的场景,需要支持ND格式下任意维度的动态设置。

ND表示支持任意格式,当前N ≤ 4。

使用约束

  • 动态AIPP和动态Batch同时使用时:
    • 调用acl.mdl.create_aipp接口设置“batchSize”时,“batchSize”要设置为最大Batch数。
    • 模型中需要进行动态AIPP处理的data节点,其对应的输入内存大小需按照最大Batch来申请。
  • 动态AIPP和动态分辨率同时使用时:
    • 若在设置动态AIPP参数时,开启了抠图或缩放或补边功能,则不能与动态分辨率同时使用。
    • 若在设置动态AIPP参数时,未开启抠图或缩放或补边功能,在与动态分辨率同时使用时,需确保通过acl.mdl.set_aipp_src_image_size接口设置的宽和高,与通过acl.mdl.set_dynamic_hw_size接口设置的宽和高相等,都必须设置成模型转换时动态分辨率最大档位的宽和高。
    • 模型中需要进行动态AIPP处理的data节点,其对应的输入内存大小需按照最大分辨率(宽、高)来申请。
  • 动态AIPP和动态Shape输入(设置Shape范围)同时使用时,动态AIPP的输出图片宽、高要在所设置的Shape范围内。
  • 静态AIPP和动态分辨率同时使用时,由于动态分辨率场景下输入图片的宽和高不确定,因此在使用ATC工具的“insert_op_conf”参数传入AIPP配置文件时,AIPP配置文件中不能开启Crop和Padding功能,并且需要将配置文件中的“src_image_size_w”“src_image_size_h”取值设置为0。

设置Shape数据缓存,提升性能

可通过设置环境变量“HOST_CACHE_CAPACITY”配置动态Shape执行时的数据缓存功能,默认值为0,不开启数据缓存功能。

配置为非零正整数时,例如10,系统会将最近出现较为频繁的10个输入Shape对应的部分执行数据缓存,已缓存Shape再次出现时,Host执行性能将得到提升,但Host内存占用会变多,具体涨幅与环境变量值、模型大小成正比。

环境变量配置示例如下:
export HOST_CACHE_CAPACITY=10

“HOST_CACHE_CAPACITY”环境变量取值范围为:[1, INT32类型最大值],超出INT32类型最大值(即2147483647),表示不开启数据缓存功能。