抽象硬件架构

AI Core是昇腾AI处理器的计算核心,昇腾AI处理器内部有多个AI Core。本章节将介绍AI Core的并行计算架构抽象,该抽象架构屏蔽了不同硬件之间的差异。使用Ascend C进行编程时,基于抽象硬件架构,可以简化硬件细节,显著降低开发门槛。如需了解更详细的硬件架构信息或者原理,请参考硬件架构与数据处理原理

图1 抽象硬件架构

AI Core中包含计算单元、存储单元、搬运单元等核心组件。

AI Core内部核心组件及组件功能详细说明如下表。
表1 AI Core内部核心组件

组件分类

组件名称

组件功能

计算单元

Scalar

执行地址计算、循环控制等标量计算工作,并把向量计算、矩阵计算、数据搬运、同步指令发射给对应单元执行。

Vector

负责执行向量运算。

Cube

负责执行矩阵运算。

存储单元

Local Memory

AI Core的内部存储。

搬运单元

DMA(Direct Memory Access)

负责数据搬运,包括Global Memory和Local Memory之间的数据搬运以及不同层级Local Memory之间的数据搬运。

开发者在理解硬件架构的抽象时,需要重点关注如下异步指令流、同步信号流计算数据流三个过程: