昇腾社区首页
中文
注册

简介

HCCL提供了C与Python两种语言的开发接口,用于实现分布式能力。
  • C语言接口用于实现单算子模式下的框架适配,实现分布式能力。

    针对PyTorch框架网络,HCCL单算子API已嵌入到Ascend Extension for PyTorch后端代码中,PyTorch用户直接使用PyTorch原生集合通信API,即可实现分布式能力。

  • Python语言接口用于实现TensorFlow网络在昇腾AI处理器执行分布式优化。

本章节针对如何调用HCCL的C语言接口进行集合通信功能的开发进行介绍。

开发者调用HCCL C接口实现集合通信功能的主要开发流程如下所示。

图1 集合通信操作流程
  1. 首先进行集群信息配置,创建通信域句柄,并初始化HCCL通信域。
  2. 实现集合通信操作,例如点对点通信、调用集合通信算子。
  3. 集合通信操作完成后,需要释放相关资源,销毁通信域。