模型运行时出现coredump,报错terminate called after throwing an instance of ‘std::runtime_error’
2025/03/18
48
问题信息
问题来源 | 产品大类 | 产品子类 | 关键字 |
---|---|---|---|
官方 | 模型训练 | PyTorch | -- |
问题现象描述
模型运行时出现报错terminate called after throwing an instance of ‘std::runtime_error’。
原因分析
当前算子异步下发,算子执行报错,抛出异常,主线程coredump。
解决措施
先导入环境变量:
export ASCEND_LAUNCH_BLOCKING=1
再执行模型,模型报错之后即可看到具体调用栈,根据调用栈继续分析问题。