简介
技术背景与价值
随着大语言模型向万卡级集群部署演进,传统的集合通信库面临以下挑战:
- 内置通信算法难以在所有场景下都实现较优性能。
- 通算融合场景需要做细粒度的流水线并行,从而有效降低计算与通信的时延,提升整体效率。
传统集合通信库封闭的黑盒设计限制了研究者探索新型通信原语,因此,HCCL开放了底层通信能力,提供轻量级通信算子开发接口,实现通信算子全栈可编程性,利于研究者开展通信方案创新。
HCCL通信算子开发接口具备以下关键特性:
- 支持昇腾设备上的多种通信引擎,充分发挥硬件能力。
- 支持多种通信协议,包括:PCIe、HCCS、RoCE。
- 通信平台能力与通信算子开发解耦,支持通信算子独立开发。
支持的产品型号
通信算子自定义开发功能当前支持以下产品:
父主题: 通信算子开发