rank间RDMA通信使用多QP通信的场景下,开发者可通过本环境变量设置每个QP分担数据量的最小阈值。
该环境变量需要配置为整数,取值范围:[1,8192],默认值:512, 单位:KB。
rank间单次通信数据量为1MB,HCCL_RDMA_QPS_PER_CONNECTION配置为4,HCCL_MULTI_QP_THRESHOLD配置为512,此时每个QP最少要求分担512KB的数据量,则HCCL执行时,会减少QP个数为2,仅使用2个QP进行rank间的数据传输。
export HCCL_MULTI_QP_THRESHOLD=512
该环境变量仅支持