使用HCCL性能测试工具前需要安装相关依赖、配置环境变量,并编译HCCL性能测试工具。
说明:以下操作需要在每个参与集合通信的机器上执行。
HCCL性能测试工具依赖MPI拉起多个进程,所以需要先安装MPI软件包。
如果通信网卡使用IPv4协议,需要安装MPI 3.2.1版本;如果通信网卡使用IPv6协议,则需要安装Open MPI-4.1.5版本。
下面操作以安装MPI 3.2.1版本的软件包为例。
将运行环境的网卡IPv6地址加入到“/etc/hosts”文件中,如下图所示:
其中node3、node4为相应节点的hostname。
注意如果是Euler OS操作系统,需要执行nmcli c reload命令使更新后的“/etc/hosts”文件生效。
以下仅为操作示例:
ssh-keygen -t rsa
例如密钥信息生成后,存储在“/root/.ssh/id_rsa.pub”文件中。
针对图1中的node3与node4节点,示例如下:
ssh-copy-id -i /root/.ssh/id_rsa.pub node3_ipv6_address ssh-copy-id -i /root/.ssh/id_rsa.pub node4_ipv6_address
export HYDRA_LAUNCHER_EXTRA_ARGS="-B 本节点的IPv6网卡名"
配置HCCL性能测试工具编译时依赖的环境变量:
export INSTALL_DIR=/usr/local/Ascend/ascend-toolkit/latest export PATH=/usr/local/mpich-3.2.1/bin:$PATH export LD_LIBRARY_PATH=/usr/local/mpich-3.2.1/lib:${INSTALL_DIR}/lib64:$LD_LIBRARY_PATH
cd ${INSTALL_DIR}/tools/hccl_test
make MPI_HOME=/usr/local/mpich-3.2.1 ASCEND_DIR=${INSTALL_DIR}
“/usr/local/mpich-3.2.1”为MPI安装与配置时设置的MPI安装路径。
编译成功后,会在${INSTALL_DIR}/tools/hccl_test/bin目录下生成集合通信性能测试工具的可执行文件,例如:
all_gather_test、all_reduce_test等,每一个可执行文件对应一个集合通信算子。