昇腾社区首页
中文
注册

Atlas训练系列产品亲和性规则

Atlas训练系列产品昇腾AI处理器是华为研发的一款高性能AI处理器。其内部的处理器之间采用HCCS(例如:A0~A3为一个HCCS)方式连接。HCCS(Huawei Collective Communication Server)是HCCL(Huawei Collective Communication Library)的硬件形态,HCCL提供了深度学习训练场景中服务器间高性能集合通信的功能。

每台设备具备两个HCCS环共8个昇腾AI处理器(A0~A7)。每个HCCS存在4个昇腾AI处理器,同一HCCS内AI处理器可做数据交换,不同HCCS内昇腾AI处理器不能通信。即同一Pod分配的昇腾AI处理器(若小于或等于4)必须在同一个HCCS环内,否则任务运行失败。Atlas训练系列产品互联拓扑如图1所示,其中K0~K3为鲲鹏处理器。

图1 Atlas训练系列产品互联拓扑图