GetTensorC

功能说明

Iterate后,获取一块C矩阵片,可以直接输出到GM tensor中,也可以输出到VECCALC tensor中。

函数原型

__aicore__ inline void GetTensorC(const LocalTensor<DstT>& co2Local, bool enAtomicAdd = false, bool enSequentialWrite = false);

__aicore__ inline void GetTensorC(const GlobalTensor<DstT>& gm, bool enAtomicAdd = false, bool enSequentialWrite = false);

参数说明

参数名

输入/输出

描述

co2Local

输出

取出C矩阵到VECCALC,数据类型T可以为half或者float,数据格式只能为NZ

Gm

输出

取出C矩阵到GM,数据类型T可以为half或者float,数据格式可以为ND或NZ

enAtomicAdd

输入

是否开启Atomic add累加到GM上,默认值false

enSequentialWrite

输入

是否开启连续写模式到GM(不跳写,写入[baseM,baseN];跳写,写入[singleM、singleN]中对应的位置),默认值false(跳写模式)

图1 跳写模式示意图
图2 非跳写模式示意图

返回值

支持的处理器型号

Atlas A2训练系列产品

注意事项

传入的C矩阵地址空间大小需要保证不小于baseM * baseN。