此环境变量用于配置单算子执行API在Host侧缓存的算子信息条目个数,单位:个,取值范围:[1,10000000],默认值为10000。
缓存的算子信息包含workspace大小、算子计算的执行器、tiling信息等。动态shape场景下,若算子shape范围较大,开发者可通过此环境变量适当增加算子缓存条目,提升调度性能。但需要注意,增加算子信息缓存条目会增加Host内存开销,详细可参见使用约束。
export ACLNN_CACHE_LIMIT=10000
否
每个算子缓存条目大约占2KB左右的Host内存,单算子cache的总内存占用大小为:ACLNN_CACHE_LIMIT * 线程数 * 2KB。
以10个线程,ACLNN_CACHE_LIMIT=100000为例,这种情况下单算子cache的总内存占用为:10*100000*2KB=2GB。
Atlas 推理系列产品
Atlas 训练系列产品
Atlas A2 训练系列产品