术语与相关概念
为了您有更好的阅读体验,使用本文档前请先了解如下术语、缩略语与基本概念。
名称 |
说明 |
NPU |
Neural Network Processing Unit,神经网络处理单元。 采用“数据驱动并行计算”的架构,特别擅长处理视频、图像类的海量多媒体业务数据,专门用于处理人工智能应用中的大量计算任务。 |
HCCL |
Huawei Collective Communication Library,华为集合通信库。 提供单机多卡以及多机多卡间的数据并行、模型并行集合通信方案。 |
HCCS |
Huawei Cache Coherent System,华为Cache一致性系统总线,用于CPU/NPU之间互联的高速总线。 |
HCCP |
Huawei Collective Communication adaptive Protocol,集合通信适配协议。 提供跨NPU设备通信能力,向上屏蔽具体通讯协议差异。 |
TOPO |
拓扑、拓扑结构。 一个局域网内或者多个局域网之间的设备连接所构成的网络配置或者布置。 |
PCIe |
Peripheral Component Interconnect Express,一种串行外设扩展总线标准,通常用于计算机系统中外设扩展使用。 |
PCIe-SW |
PCIe Switch,符合PCIe总线扩展的交换设备。 |
AI节点 |
昇腾AI节点,又称昇腾AI Server,通常是8P或16P昇腾NPU组成的服务器形态的统称。 |
AI集群 |
多个AI节点通过交换机(Switch)互联后用于分布式训练或推理的系统。 |
通信域 |
包含了一组参与通信的NPU设备以及设备对应的通信进程。 |