aclnnGemm

产品支持情况

[object Object]undefined

功能说明

算子功能：计算α 乘以A与B的乘积，再与β 和input C的乘积求和。
计算公式：
- 若transA非零，计算前会将A进行转置；同样的，若transB非零，则会将B进行转置。
  $out = α (A @ B) + β C$
- 若transA与transB都为非零，则计算公式为：
  $out = α (A^T @ B^T) + βC$

函数原型

每个算子分为，必须先调用“aclnnGemmGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小，再调用“aclnnGemm”接口执行计算。

[object Object]

aclnnGemmGetWorkspaceSize

参数说明：
[object Object]
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：
  - A 数据类型支持BFLOAT16、FLOAT16、FLOAT32。
  - B 数据类型支持BFLOAT16、FLOAT16、FLOAT32。
  - C 数据类型支持BFLOAT16、FLOAT16、FLOAT32。
  - out 数据类型支持BFLOAT16、FLOAT16、FLOAT32。
  - cubeMathType=1，当输入数据类型为FLOAT32时，会转换为HFLOAT32计算，当输入为其他数据类型时不做处理；
  - cubeMathType=2，当输入数据类型为BFLOAT16时不支持该选项；
  - cubeMathType=3，当输入数据类型为FLOAT32时，会转换为HFLOAT32计算，当输入为其他数据类型时不支持该选项。
- [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：
  - A 数据类型支持FLOAT16、FLOAT32。
  - B 数据类型支持FLOAT16、FLOAT32。
  - C 数据类型支持FLOAT16、FLOAT32。
  - out 数据类型支持FLOAT16、FLOAT32。
  - 不支持BFLOAT16数据类型；
  - 当输入数据类型为FLOAT32时不支持cubeMathType=0；
  - cubeMathType=1，当输入数据类型为FLOAT32时，会转换为FLOAT16计算，当输入为其他数据类型时不做处理；
  - 不支持cubeMathType=3。
返回值：

aclnnStatus：返回状态码，具体参见。

第一段接口完成入参校验，出现以下场景时报错： [object Object][object Object] [object Object] [object Object] [object Object] [object Object] [object Object] [object Object] [object Object]返回值[object Object] [object Object]错误码[object Object] [object Object]描述[object Object] [object Object][object Object] [object Object] [object Object] [object Object]ACLNN_ERR_PARAM_NULLPTR[object Object] [object Object]161001[object Object] [object Object]传入的A, B，C或out是空指针。[object Object] [object Object] [object Object] [object Object]ACLNN_ERR_PARAM_INVALID[object Object] [object Object]161002[object Object] [object Object]数据类型和数据格式不在支持的范围之内。[object Object] [object Object] [object Object] [object Object]A或B不是2维，或者进行计算时，shape不满足[m, k]和[k, n]的k维度相等关系。[object Object] [object Object] [object Object] [object Object]self不能与batch1@batch2做broadcast操作。[object Object] [object Object] [object Object] [object Object]C和AB计算后的结果不满足broadcast关系。[object Object] [object Object] [object Object] [object Object]out和AB计算后的shape不一致。[object Object] [object Object] [object Object] [object Object]cubeMathType为非法值。[object Object] [object Object] [object Object] [object Object]

aclnnGemm

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

约束说明

确定性说明：
- [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：aclnnGemm默认确定性实现。
[object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：Cube单元不支持FLOAT32计算。当输入为FLOAT32，可通过设置cubeMathType=1（ALLOW_FP32_DOWN_PRECISION）来允许接口内部cast到FLOAT16进行计算.

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]