昇腾社区首页
中文
注册
开发者
下载

torch.distributed.distributed_c10d._world.default_pg._get_backend(torch.device("npu")).get_hccl_comm_name

产品支持情况

[object Object]undefined

功能说明

从初始化完成的集合通信域中获取集合通信域名字。

函数原型

[object Object]

注:接口为PyTorch的ProcessGroup类,backend为NPU backend的方法。ProcessGroup可以为default_pg,也可以为[object Object]创建的非default_pg。

[object Object]

参数说明

  • rankid ([object Object]):必选参数,集合通信对应device的rankid。传入的rankid为全局的rankid,多机间device具有唯一的rankid。

  • init_comm ([object Object]):可选参数,默认值为True。当值为True时,调用[object Object]会在hccl还未完成初始化的情况下完成初始化,并返回group name。当值为False时,调用[object Object]在hccl还未完成初始化时,不会进行初始化(包括申请内存资源等操作),并返回空字符串。

[object Object]

返回值说明

[object Object]

代表string类型的集合通信域的名字。

约束说明

  • 使用该接口前确保[object Object]已被调用,且初始化的backend为hccl。
  • PyTorch 2.1.0及以后版本与PyTorch 2.1.0之前的版本对该接口调用方式不同,见

调用示例[object Object][object Object]

[object Object]