昇腾社区首页
中文
注册
开发者
下载

HCCL简介

集合通信库HCCL(Huawei Collective Communication Library)是基于昇腾硬件的高性能集合通信库,为计算集群提供高性能、高可靠的通信方案。

核心功能

  • 提供单机、多机环境中的高性能集合通信和点对点通信。
  • 支持AllReduce、Broadcast、AllGather、ReduceScatter、AlltoAll、Send、Receive等集合通信原语。
  • 支持Ring、Mesh、Recursive Halving-Doubling(RHD)等通信算法。
  • 支持HCCS、RoCE、PCIe等高速通信链路。
  • 支持单算子和图模式两种执行模式。

软件架构

HCCL是CANN的核心组件,为NPU集群提供高性能、高可靠性的通信方案。HCCL向上支持多种AI框架,向下实现多款昇腾AI处理器之间的高效互联,其架构如图1所示。

图1 集合通信库软件架构图

HCCL包含HCCL集合通信库与HCOMM(Huawei Communication)通信基础库:
  • HCCL集合通信库:提供多种集合通信算子与点对点通信算子,同时,也支持开发者自定义扩展通信算子。
  • HCOMM通信基础库:提供集合通信域以及通信资源(内存、流、通信连接等)的管理能力。

支持的产品型号

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品

Atlas 训练系列产品

Atlas 300I Duo 推理卡