环境变量参考
加速库安装完成后,提供进程级环境变量设置脚本“set_env.sh”,以自动完成环境变量设置,用户进程结束后自动失效。
Transformer加速库环境变量说明
- 基础环境变量
环境变量名
说明
ATB_HOME_PATH
软件包安装后文件存储路径。
LD_LIBRARY_PATH
库路径列表。
PATH
路径列表。
- 加速库相关环境变量
环境变量名
默认值
功能说明
配置说明
ATB_STREAM_SYNC_EVERY_KERNEL_ENABLE
0
每个Kernel的Execute时就做同步。
0:关闭同步。
1:开启同步。
ATB_STREAM_SYNC_EVERY_RUNNER_ENABLE
0
每个Runner的Execute时就做同步。
0:关闭同步。
1:开启同步。
ATB_STREAM_SYNC_EVERY_OPERATION_ENABLE
0
每个Operation的Execute时就做同步。
0:关闭同步。
1:开启同步。
ATB_OPSRUNNER_SETUP_CACHE_ENABLE
1
是否开启SetupCache,当检查到输入和输出没有变化时,不做setup。
0:关闭Setup缓存。
1:开启Setup缓存。
ATB_OPSRUNNER_KERNEL_CACHE_TYPE
3
是否开启本地/全局缓存。
0:不开启。
1:开启本地缓存。
2:开启全局缓存。
3:同时开启本地和全局缓存。
ATB_OPSRUNNER_KERNEL_CACHE_LOCAL_COUNT
1
本地缓存个数。
支持范围:1~1024。
ATB_OPSRUNNER_KERNEL_CACHE_GLOABL_COUNT
5
全局缓存个数。
支持范围:1~1024。
ATB_OPSRUNNER_KERNEL_CACHE_TILING_SIZE
10240
tiling默认大小。
支持范围:1~1073741824。
ATB_WORKSPACE_MEM_ALLOC_ALG_TYPE
1
workspace内存分配算法选择。
0:暴力算法。
1:block分配算法。
2:有序heap算法。
3:引入block合并(SOMAS算法退化版)。
ATB_WORKSPACE_MEM_ALLOC_GLOBAL
0
是否开启全局中间tensor内存分配。
0:不开启。
1:开启。
ATB_COMPARE_TILING_EVERY_KERNEL
0
每个Kernel运行后,比较运行前和后的NPU上tiling内容是否变化。
0:不开启。
1:开启。
ATB_HOST_TILING_BUFFER_BLOCK_NUM
128
Context内部HostTilingBuffer块数,通常使用默认值即可。
配置范围:128~1024。
ATB_DEVICE_TILING_BUFFER_BLOCK_NUM
32
Context内部DeviceTilingBuffer块数,通常使用默认值即可。
配置范围:32~1024。
ATB_SHARE_MEMORY_NAME_SUFFIX
""
共享内存命名后缀,多用户同时使用通信算子时,需通过设置该值进行共享内存的区分。
可配置为任意字符串
ATB_LAUNCH_KERNEL_WITH_TILING
1
tiling拷贝随算子下发功能开关。
0:关闭功能。
1:开启功能。
ATB_MATMUL_SHUFFLE_K_ENABLE
1
Shuffle-K使能,矩阵乘的结果矩阵不同位置计算时的累加序一致/不一致
0:不使能,累加序一致。
1:使能,累加序不一致。
ATB_RUNNER_POOL_SIZE
64
加速库runner池中可存放runner的个数。
支持范围:0~1024。
为0时不开启runner池功能。
- 算子库相关环境变量
环境变量名
默认值
功能说明
配置说明
ASDOPS_HOME_PATH
"${atb_path}"
算子库路径。
指定合法路径。
ASDOPS_OPS_PATH
$ASDOPS_HOME_PATH/ops
算子库op路径。
指定合法路径 。
ASDOPS_MATMUL_PP_FLAG
1
算子库开启使用PPMATMUL。
0:使用TBE matmul算子。
1:使用算子库ppmatmul。
ASDOPS_LOG_LEVEL
FATAL
算子库日志级别。
严重级别从高到低:FATAL、ERROR、WARN、INFO、DEBUG、TRACE。
ASDOPS_LOG_TO_STDOUT
0
算子库日志是否输出到控制台。
0: 关闭。
1: 开启输出到控制台。
ASDOPS_LOG_TO_FILE
0
算子库日志是否输出到文件。
0: 关闭。
1: 开启输出到文件。
ASDOPS_LOG_TO_FILE_FLUSH
0
日志写文件是否刷新。
0: 关闭。
1: 开启。
ASDOPS_LOG_TO_BOOST_TYPE
atb
加速库日志目录名称。
任意合法目录名称。
ASDOPS_TILING_PARSE_CACHE_DISABLE
0
算子库tilingParse禁止进行缓存优化。
0: 开启缓存优化。
1: 关闭缓存优化。
ASDOPS_LOG_PATH
~
算子库日志保存路径。
合法路径。
LCCL_DETERMINISTIC
0
LCCL确定性AllReduce(保序加)是否开启。
在rankSize<=8时生效。
0: 关闭。
1: 开启。
ASDOPS_QUANT_MIN_NEG_127
0
int8量化输出的最小值是否为-127。
0:最小值为-128。
1:最小值为-127。