适用场景
- 业务场景:DVPP,昇腾模型算法,模型转化,精度调优、应用/算子开发,性能调优、TensorFlow训练
- 适用处理器:
- Atlas 200/300/500 推理产品
- Atlas 推理系列产品(Ascend 310P处理器)
- Atlas 训练系列产品
- Atlas 200/500 A2推理产品
- 处理器形态:EP、RC
现象描述
查看dmesg信息,hdc驱动会话连接接口返回-512,有如下打印信息:
[ERROR][hdcdrv][hdcdrv_connect_wait_reply 2730]<hlt_hdc_test:41039>dev 3 connect wait error -512, local session_fd 153, remote session_fd ffffffff, pid -1
[ERROR][hdcdrv][hdcdrv_connect 2857]<hlt_hdc_test:41039>device 3 service service_usr4 connect wait error -512, local session_fd 153, remote session_fd ffffffff, pid -1
可能原因
根据日志反馈码信息分析,可能是以下原因导致:
- 发起hdc会话连接的客户端进程,会等待服务端回复连接消息,如果在服务端回复连接消息前,对客户端进程执行ctrl+c或者kill -9操作,客户端进程退出,出现如上打印信息,属于正常现象,不需要处理。
- 使用gdb7.6跟踪调试程序,因gdb7.6通过tkill引入SIGSTOP信号,即使该操作是对于单个线程的,也会导致整个线程组中断崩溃,可能会出现如上打印,不符合预期执行结果。此时,需要客户新安装更高版本的gdb进行调试。