简介 HCCL提供了C与Python两种语言的开发接口,用于实现分布式能力。C语言接口用于实现单算子模式下的框架适配,实现分布式能力。针对PyTorch框架网络,HCCL单算子API已嵌入到Ascend Extension for PyTorch后端代码中,PyTorch用户直接使用PyTorch原生集合通信API,即可实现分布式能力。 Python语言接口用于实现TensorFlow网络在昇腾AI处理器执行分布式优化。 本章节针对如何调用HCCL的C语言接口进行集合通信功能的开发进行介绍。 开发者调用HCCL C接口实现集合通信功能的主要开发流程如下所示。 图1 集合通信操作流程 首先进行集群信息配置,创建通信域句柄,并初始化HCCL通信域。实现集合通信操作,例如点对点通信、调用集合通信算子。集合通信操作完成后,需要释放相关资源,销毁通信域。 父主题: 集合通信开发