AI Core是昇腾AI处理器的计算核心,昇腾AI处理器内部有多个AI Core。本章节将介绍AI Core的并行计算架构抽象,该抽象架构屏蔽了不同硬件之间的差异。使用Ascend C进行编程时,基于抽象硬件架构,可以简化硬件细节,显著降低开发门槛。如需了解更详细的硬件架构信息或者原理,请参考硬件架构与数据处理原理。
AI Core中包含计算单元、存储单元、搬运单元等核心组件。
组件分类 |
组件名称 |
组件功能 |
---|---|---|
计算单元 |
Scalar |
执行地址计算、循环控制等标量计算工作,并把向量计算、矩阵计算、数据搬运、同步指令发射给对应单元执行。 |
Vector |
负责执行向量运算。 |
|
Cube |
负责执行矩阵运算。 |
|
存储单元 |
Local Memory |
AI Core的内部存储。 |
搬运单元 |
DMA(Direct Memory Access) |
负责数据搬运,包括Global Memory和Local Memory之间的数据搬运以及不同层级Local Memory之间的数据搬运。 |
开发者在理解硬件架构的抽象时,需要重点关注如下异步指令流、同步信号流、计算数据流三个过程: