进程异常时资源清理的处理建议
适用场景
- 业务场景:DVPP、模型推理、应用/算子开发
- 适用处理器:Atlas 200/300/500 推理产品、Atlas 推理系列产品、Atlas 训练系列产品
- 处理器形态:EP、RC
现象描述
用户捕获异常退出信号,并在信号处理函数中释放已申请资源,下一次执行时会报执行失败。此时查看日志,会发现unbind model stream failed报错。
可能原因
进程异常时,Host侧内核态驱动会自动检测并发起对应进程Device侧资源释放的流程,不需要用户捕获进程异常的信号并主动完成清理。若用户主动释放,会影响到系统的资源释放流程。
处理步骤
用户无需关注进程异常退出信号,不要对异常退出信号做处理。
父主题: 常见故障分析与处理