HcclBatchSendRecv
产品支持情况
产品 |
是否支持 |
|---|---|
√ |
|
√ |
|
☓ |
|
☓ |
|
☓ |
|
√ |
功能说明
异步批量点对点通信操作接口,调用一次接口可以完成本rank上的多个收发任务,本rank发送和接收之间是异步的,发送和接收任务之间不会相互阻塞。
函数原型
1 | HcclResult HcclBatchSendRecv(HcclSendRecvItem* sendRecvInfo, uint32_t itemNum, HcclComm comm, aclrtStream stream) |
参数说明
参数名 |
输入/输出 |
描述 |
|---|---|---|
sendRecvInfo |
输入 |
本rank需要下发的收发任务列表的首地址。 HcclSendRecvItem类型,详细可参见HcclSendRecvItem。 |
itemNum |
输入 |
本rank需要接收和发送的任务个数。 |
comm |
输入 |
集合通信操作所在的通信域。 |
stream |
输入 |
本rank所使用的stream。 |
返回值
HcclResult:接口成功返回HCCL_SUCCESS,其他失败。
约束说明
- “异步”是指同一张卡上的接收和发送任务是异步的,不会相互阻塞。但是在卡间,收发任务依旧是同步的,因此,卡间的收发任务也同HcclSend、HcclRecv一样,必须是一一对应的。
- 任务列表中不能有重复的send/recv任务,重复指向(从)同一rank发送(接收)的两个任务。
- 当前版本此接口不支持Virtual Pipeline(VPP)开启的场景。
- 针对
Atlas A2 训练系列产品 ,在大规模集群下(ranksize>500)使用此接口时,并发执行数不能超过3个。 - 针对Atlas 200T A2 Box16 异构子框,若Server内卡间出现建链失败的情况(错误码:EI0010),需要将环境变量HCCL_INTRA_ROCE_ENABLE配置为1,HCCL_INTRA_PCIE_ENABLE配置为0,让Server内采用RoCE环路进行多卡间的通信(请确保Server上存在RoCE网卡,且具有send/recv收发关系的设备之间RDMA链路互通),环境变量配置示例如下:
export HCCL_INTRA_ROCE_ENABLE=1 export HCCL_INTRA_PCIE_ENABLE=0
调用示例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 | // 申请集合通信操作的 Device 内存 void *sendBuf = nullptr; void *recvBuf = nullptr; uint64_t count = 8; size_t mallocSize = count * sizeof(float); aclrtMalloc((void **)&sendBuf, mallocSize, ACL_MEM_MALLOC_HUGE_FIRST); aclrtMalloc((void **)&recvBuf, mallocSize, ACL_MEM_MALLOC_HUGE_FIRST); // 初始化通信域 uint32_t rankSize = 8; HcclComm hcclComm; HcclCommInitRootInfo(rankSize, &rootInfo, deviceId, &hcclComm); // 创建任务流 aclrtStream stream; aclrtCreateStream(&stream); // 执行 Send/Recv,将数据发送至下一节点,同时接收上一节点的数据 // HcclBatchSendRecv 可以同时下发本 rank 上的多个收发任务 uint32_t next = (deviceId + 1) % count; uint32_t prev = (deviceId - 1 + count) % count; HcclSendRecvItem sendRecvInfo[2]; sendRecvInfo[0] = HcclSendRecvItem{HCCL_SEND, sendBuf, count, HCCL_DATA_TYPE_FP32, next}; sendRecvInfo[1] = HcclSendRecvItem{HCCL_RECV, recvBuf, count, HCCL_DATA_TYPE_FP32, prev}; HcclBatchSendRecv(sendRecvInfo, 2, hcclComm, stream); // 阻塞等待任务流中的集合通信任务执行完成 ACLCHECK(aclrtSynchronizeStream(stream)); // 释放资源 aclrtFree(sendBuf); // 释放 Device 侧内存 aclrtFree(recvBuf); // 释放 Device 侧内存 aclrtDestroyStream(stream); // 销毁任务流 HcclCommDestroy(hcclComm); // 销毁通信域 |
父主题: 点对点通信