华为计算微信公众号
昇腾AI开发者公众号
华为计算微博
华为计算今日头条
昇腾社区首页
中文
注册
登录
主页
核心组件
Ascend C 算子编程语言
AOL 算子加速库
HCCL 集合通信库
GE 图引擎
BiSheng Compiler 毕昇编译器
RunTime 运行时
Driver 驱动
开源开放
开源开放地图
贡献路径
论坛
治理架构
学习
学习路径
在线课程
在线实验
认证
下载
文档
支持
HCCL集合通信库
暂无评分
我要评分
集合通信库( Huawei Collective Communication Library ,简称HCCL)是基于昇腾硬件的高性能集合通信库,提供单机多卡以及多机多卡间的数据并行、模型并行集合通信方案。HCCL支持AllReduce、Broadcast、Allgather、ReduceScatter、AlltoAll等通信原语,Ring、Mesh、HD等通信算法,在HCCS、RoCE和PCIe高速链路实现集合通信
立即下载
获取源码
关键特性
高性能集合通信算法
提升大规模并行计算通信效率
服务器内基础拓扑为Full Mesh互联拓扑,每个Full Mesh互联拓扑内的基础算法为Mesh算法。服务器间为Fat Tree互联拓扑,支持HD、Ring、NHR等通信算法
计算通信统一硬化调度
降低调度开销,优化硬件资源利用率
专用硬件调度引擎和硬件通信原语,实现计算任务与通信任务全硬化调度,降低调度开销,精准控制系统抖动
计算通信高性能并发
计算与通信并发流水执行,系统性能进一步提升
“归约”类集合通信操作( AllReduce 、ReduceScatter 、Reduce)通过随路方式实现,不占用计算资源。计算通信任务并发执行,总执行时长大幅降低
开源开放项目
cann-hccl
高性能通信
灵活适配
易用可验证
基于昇腾AI处理器的高性能集合通信库
141
98
55
Ascend Extension for PyTorch
扩展项目
算力适配
版本兼容
灵活安装
为使用PyTorch框架的开发者提供昇腾AI处理器的超强算力
621
1214
84
MindSpeed
扩展项目
高效加速
全面兼容
易用灵活
针对华为昇腾设备的大模型加速库
357
483
53
了解更多
开发资源
课程
HCCL视频教程,原理、组网、案例等由浅入深详细讲解
集合通信HCCL
了解更多
文档
了解HCCL架构、算子算法原理,学习如何调用集合通信接口开发通信功能。
集合通信用户指南
集合通信接口参考
集合通信性能测试
了解更多
支持与帮助
昇腾论坛
问题求助,技术探讨,大咖在线答疑解惑
支持与服务
为您提供多样化的自助查询途径、专业高效的人工服务支持