昇腾社区首页
中文
注册

数据准备

  1. 当推理过程中发现AI Core Error问题时,用户需在重新执行ATC模型转换前导入如下环境变量。

    具体细节请参见ATC工具使用指南日志参考

    export DUMP_GE_GRAPH=1  # 控制dump图的内容多少,取值为1,全量dump
    export DUMP_GRAPH_LEVEL=1  # 控制dump图的个数,取值为1,dump所有图
    export ASCEND_GLOBAL_LOG_LEVEL=1  # 设置全局日志级别,取值为1,代表INFO
  2. 在重新执行ATC模型转换时,需配置op_debug_level参数(例如:--op_debug_level=2)。

    具体流程请参见ATC工具使用指南

    表1 op_debug_level参数取值说明

    取值

    说明

    0

    不开启算子debug功能,默认为0。

    1

    生成TBE指令映射文件(在命令执行目录下kernel_meta文件夹中生成算子cce文件*.cce和python-cce映射文件*_loc.json),用于后续工具进行AI Core Error问题定位。

    2

    生成TBE指令映射文件(在命令执行目录下kernel_meta文件夹中生成算子cce文件*.cce和python-cce映射文件*_loc.json),并关闭编译优化开关(开启ccec编译器选项-O0-g),用于后续工具进行AI Core Error问题定位。

    3

    不开启算子debug功能,且保留.o和.json文件。

  3. 重新执行模型转换后,会在执行目录下生成指令映射文件。