IterateAll

功能说明

调用一次IterateAll,会计算出singleCoreM * singleCoreN大小的C矩阵。迭代顺序可通过tiling参数iterateOrder调整。

函数原型

__aicore__ inline void IterateAll(const GlobalTensor<DstT>& gm, bool enAtomicAdd = false);

__aicore__ inline void IterateAll(const LocalTensor<DstT>& ubCmatrix, bool enAtomicAdd = false);

参数说明

参数名

输入/输出

描述

gm

输入

C矩阵放置于Global Memory的地址。

Atlas 训练系列产品,支持的数据类型为:float

Atlas推理系列产品AI Core,支持的数据类型为:float

Atlas A2训练系列产品,支持的数据类型为:half/float

ubCmatrix

输入

C矩阵放置于Local Memory的地址。

Atlas 训练系列产品,支持的数据类型为:float

Atlas推理系列产品AI Core,支持的数据类型为:float

Atlas A2训练系列产品,支持的数据类型为:half/float

enAtomicAdd

输入

是否开启Atomic add累加到Global Memory上, 默认值false。

返回值

支持的处理器型号

Atlas A2训练系列产品

注意事项

传入的C矩阵地址空间大小需要保证不小于singleM * singleN。