SetTensorA

功能说明

设置矩阵乘的左矩阵A。

函数原型

__aicore__ inline void SetTensorA(const GlobalTensor<SrcT>& gm, bool isTransposeA = false);

__aicore__ inline void SetTensorA(const LocalTensor<SrcT>& leftMatrix, bool isTransposeA = false);

参数说明

表1 参数说明

参数名

输入/输出

描述

gm

输入

A矩阵在Global Memory上的首地址。

Atlas 训练系列产品,支持的数据类型为:float

Atlas推理系列产品AI Core,支持的数据类型为:float

Atlas A2训练系列产品,支持的数据类型为:half/float

leftMatrix

输入

A矩阵在TSCM上的首地址或者在VECCALC上的首地址。

Atlas 训练系列产品,支持的数据类型为:float

Atlas推理系列产品AI Core,支持的数据类型为:float

Atlas A2训练系列产品,支持的数据类型为:half/float

  • 若设置TSCM首地址,默认矩阵可全载,已经位于TSCM,Iterate接口无需再进行GM->A1/B1搬运。
  • 若设置VECCALC首地址
    • 针对Atlas 推理系列产品Atlas 训练系列产品:Iterate不会进行GM->VECCALC搬运,仅支持NZ格式,不进行格式转换。
    • 针对Atlas A2训练系列产品:Iterate通路为VECCALC->GM->A1/B1,不进行格式转换。

isTransposeA

输入

A矩阵是否需要转置。

返回值

支持的处理器型号

Atlas A2训练系列产品

注意事项

传入的TensorA地址空间大小需要保证不小于singleM * singleK。