Iterate后,获取一块C矩阵片,可以直接输出到GM tensor中,也可以输出到VECCALC tensor中。
__aicore__ inline void GetTensorC(const LocalTensor<DstT>& co2Local, bool enAtomicAdd = false, bool enSequentialWrite = false);
__aicore__ inline void GetTensorC(const GlobalTensor<DstT>& gm, bool enAtomicAdd = false, bool enSequentialWrite = false);
参数名 |
输入/输出 |
描述 |
---|---|---|
co2Local |
输出 |
取出C矩阵到VECCALC,数据类型T可以为half或者float,数据格式只能为NZ |
Gm |
输出 |
取出C矩阵到GM,数据类型T可以为half或者float,数据格式可以为ND或NZ |
enAtomicAdd |
输入 |
是否开启Atomic add累加到GM上,默认值false |
enSequentialWrite |
输入 |
是否开启连续写模式到GM(不跳写,写入[baseM,baseN];跳写,写入[singleM、singleN]中对应的位置),默认值false(跳写模式) |
无
Atlas A2训练系列产品
传入的C矩阵地址空间大小需要保证不小于baseM * baseN。