概念及使用约束
相关概念
概念 |
描述 |
---|---|
动态Batch/动态分辨率 |
在某些场景下,模型每次输入的batch size或分辨率是不固定的,如检测出目标后再执行目标识别网络,由于目标个数不固定导致目标识别网络输入BatchSize不固定。
|
动态维度(ND格式) |
为了支持Transformer等网络在输入格式的维度不确定的场景,需要支持ND格式下任意维度的动态设置。 |
使用约束
设置Shape数据缓存,提升性能
动态Shape输入的模型推理场景下,若需提升性能,可通过设置环境变量HOST_CACHE_CAPACITY配置动态Shape执行时的数据缓存功能,默认值为0,不开启数据缓存功能;配置为非零正整数时,例如10,系统会将最近出现较为频繁的10个输入Shape对应的部分执行数据缓存,已缓存Shape再次出现时,Host执行性能将得到提升,但Host内存占用会变多,具体涨幅与环境变量值、模型大小成正比。
环境变量配置示例如下:
export HOST_CACHE_CAPACITY=10
注意,HOST_CACHE_CAPACITY环境变量取值范围为:[1, INT32类型最大值],超出INT32类型最大值(即2147483647),表示不开启数据缓存功能。
父主题: 模型动态Shape输入推理