在模型运行时遇到报错“ImportError: libhccl.so.”

问题描述

问题分析

根据报错信息“libhccl.so: cannot open shared object file: No such file or directory”,出现上述错误原因为缺少hccl库文件。目前对外发布的PyTorch安装包,默认使用NPU和HCCL功能,因此在调用时需要将HCCL模块路径添加到环境变量中。

处理方法

执行以下命令(请注意修改命令中的安装目录为实际CANN安装路径):

source Ascend-cann-toolkit安装目录/ascend-toolkit/set_env.sh