主流框架集成
场景说明
HCCL在系统中的位置如下图所示。
图1 HCCL在系统中的位置示例

AI框架主要有三种编程执行形态,单算子模式、图模式(Ascend IR)和图捕获模式(aclgraph),因此HCCL也提供了对应的工作方式。
针对PyTorch和MindSpore框架,HCCL的调用已集成到PyTorch适配插件Ascend Extension for PyTorch和MindSpore框架代码中,开发者指定使用HCCL作为分布式后端,直接使用框架原生通信API,即可实现分布式能力,详细使用方法可参见《Ascend Extension for PyTorch 产品文档》和MindSpore官网。
针对TensorFlow框架,HCCL通过TensorFlow适配插件TF Adapter对接TensorFlow框架,详细使用方法可参见《TensorFlow 1.15模型迁移指南》与《TensorFlow 2.6.5模型迁移指南》。