数据准备
- 当推理过程中发现AI Core Error问题时,用户需在重新执行ATC模型转换前导入如下环境变量。
export DUMP_GE_GRAPH=1 # 控制dump图的内容多少,取值为1,全量dump export DUMP_GRAPH_LEVEL=1 # 控制dump图的个数,取值为1,dump所有图 export ASCEND_GLOBAL_LOG_LEVEL=1 # 设置全局日志级别,取值为1,代表INFO
- 在重新执行ATC模型转换时,需配置op_debug_level参数(例如:--op_debug_level=2)。
表1 op_debug_level参数取值说明 取值
说明
0
不开启算子debug功能,默认为0。
1
生成TBE指令映射文件(在命令执行目录下kernel_meta文件夹中生成算子cce文件*.cce和python-cce映射文件*_loc.json),用于后续工具进行AI Core Error问题定位。
2
生成TBE指令映射文件(在命令执行目录下kernel_meta文件夹中生成算子cce文件*.cce和python-cce映射文件*_loc.json),并关闭编译优化开关(开启ccec编译器选项-O0-g),用于后续工具进行AI Core Error问题定位。
3
不开启算子debug功能,且保留.o和.json文件。
- 重新执行模型转换后,会在执行目录下生成指令映射文件。