(beta)torch.distributed.ProcessGroupHCCL
接口原型
torch.distributed.ProcessGroupHCCL(store, rank, size, timeout); -> ProcessGroup
功能描述
创建一个ProcessGroupHCCL对象并返回。
参数说明
- store:torch.distributed.distributed_c10d.PrefixStore对象,可以通过构造函数构造。
 - rank:当前节点的rank序号。
 - size:全部通讯节点的数量。
 - timeout:通讯中断时间,判断节点断联,默认值为1800s。
 
支持的型号
Atlas 训练系列产品 Atlas A2 训练系列产品 Atlas A3 训练系列产品 Atlas 推理系列产品 
父主题: Distributed