昇腾社区首页
中文
注册

总体流程

  1. 进行模型训练时,发现了AI Core Error问题。
  2. 配置支持AI Core Error分析工具相关参数,包括如下参数:
    • 支持异常算子代码行号映射的op_debug_level参数。
    • 支持dump异常算子信息的enable_exception_dump参数。
  3. 重新执行模型训练脚本,生成指令映射文件和异常算子的dump文件。
  4. 使用AI Core Error分析工具解析问题。