HcclAllGather
产品支持情况
产品  | 
是否支持  | 
|---|---|
√  | 
|
√  | 
|
x  | 
|
x  | 
|
√  | 
|
√  | 
 针对
功能说明
集合通信算子AllGather的操作接口,将通信域内所有节点的输入按照rank id重新排序,然后拼接起来,再将结果发送到所有节点的输出。

 针对AllGather操作,每个节点都接收按照rank id重新排序后的数据集合,即每个节点的AllGather输出都是一样的。
函数原型
1 | HcclResult HcclAllGather(void *sendBuf, void *recvBuf, uint64_t sendCount, HcclDataType dataType, HcclComm comm, aclrtStream stream)  | 
参数说明
参数名  | 
输入/输出  | 
描述  | 
|---|---|---|
sendBuf  | 
输入  | 
源数据buffer地址。  | 
recvBuf  | 
输出  | 
目的数据buffer地址,集合通信结果输出至此buffer中。  | 
sendCount  | 
输入  | 
参与allgather操作的sendBuf的数据size,recvBuf的数据size则等于count * rank size。  | 
dataType  | 
输入  | 
allgather操作的数据类型,HcclDataType类型。 针对 针对 针对 针对Atlas 300I Duo 推理卡,支持数据类型:int8、uint8、int16、uint16、int32、uint32、int64、uint64、float16、float32、float64。  | 
comm  | 
输入  | 
集合通信操作所在的通信域。  | 
stream  | 
输入  | 
本rank所使用的stream。  | 
返回值
HcclResult:接口成功返回HCCL_SUCCESS,其他失败。
约束说明
- 所有rank的sendCount、dataType均应相同。
 - 针对Atlas 300I Duo 推理卡,仅支持单Server场景,单Server中最大支持部署16张Atlas 300I Duo 推理卡(即32个NPU)。