接口原型
torch.distributed.ProcessGroupHCCL(store, rank, size, timeout); -> ProcessGroup
功能描述
创建一个ProcessGroupHCCL对象并返回。
参数说明
- store:torch.distributed.distributed_c10d.PrefixStore对象,可以通过构造函数构造。
- rank:当前节点的rank序号。
- size:全部通讯节点的数量。
- timeout:通讯中断时间,判断节点断联,默认值为1800s。
支持的型号
- Atlas 训练系列产品
- Atlas A2 训练系列产品
- Atlas A3 训练系列产品
- Atlas 推理系列产品