昇腾社区首页
中文
注册
开发者
下载

主流框架集成

场景说明

HCCL在系统中的位置如下图所示。

图1 HCCL在系统中的位置示例

AI框架主要有两种编程执行形态,单算子模式和图模式。因此HCCL也提供了单算子和图模式两种工作方式。
  • 单算子模式下,AI框架直接调用HCCL的C接口,下发通信算子给HCCL执行。
  • 图模式下,AI框架使用Ascend算子IR将模型的计算过程构造成一张图,通过Graph Engine(简称GE)将图中的通信算子下发给HCCL执行,关于图模式的详细介绍,可参见图模式开发指南
PyTorch和MindSpore框架网络支持HCCL的单算子和图模式两种工作方式,TensorFlow框架网络支持HCCL的图模式。
  • PyTorch框架:

    HCCL API已集成到PyTorch适配插件Ascend Extension for PyTorch的代码中,PyTorch用户指定使用HCCL作为分布式后端,直接使用PyTorch原生通信API,即可实现分布式能力,详细使用方法可参见《Ascend Extension for PyTorch 产品文档》。

  • MindSpore框架:

    HCCL API已集成到MindSpore框架代码中,MindSpore用户指定使用HCCL作为分布式后端,直接使用MindSpore原生通信API,即可实现分布式能力,详细使用方法可参见MindSpore官网

  • TensorFlow

    HCCL通过TensorFlow适配插件TF Adapter对接TensorFlow框架,详细使用方法可参见TensorFlow 1.15模型迁移指南TensorFlow 2.6.5模型迁移指南