开发者
资源

aclblasHgemm

产品支持情况

产品

是否支持

Atlas 350 加速卡

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

功能说明

执行矩阵-矩阵的乘法,C = αAB + βC,输入数据和输出数据的数据类型为aclFloat16。异步接口。

函数原型

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
aclError aclblasHgemm(aclTransType transA,
aclTransType transB,
aclTransType transC,
int m,
int n,
int k,
const aclFloat16 *alpha,
const aclFloat16 *matrixA,
int lda,
const aclFloat16 *matrixB,
int ldb,
const aclFloat16 *beta,
aclFloat16 *matrixC,
int ldc,
aclComputeType type,
aclrtStream stream)

参数说明

参数名

输入/输出

说明

transA

输入

A矩阵是否转置的标记。类型定义请参见aclTransType

transB

输入

B矩阵是否转置的标记。类型定义请参见aclTransType

transC

输入

C矩阵的标记。类型定义请参见aclTransType

当前仅支持ACL_TRANS_N。

m

输入

矩阵A的行数与矩阵C的行数。

n

输入

矩阵B的列数与矩阵C的列数。

k

输入

矩阵A的列数与矩阵B的行数。

alpha

输入

用于执行乘操作的标量α的指针。类型定义请参见aclFloat16

matrixA

输入

矩阵A的指针。类型定义请参见aclFloat16

lda

输入

A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

matrixB

输入

矩阵B的指针。类型定义请参见aclFloat16

ldb

输入

B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。

预留参数,当前只能设置为-1。

beta

输入

用于执行乘操作的标量β的指针。类型定义请参见aclFloat16

matrixC

输入&输出

矩阵C的指针。类型定义请参见aclFloat16

ldc

输入

C矩阵的主维,预留参数,当前只能设置为-1。

type

输入

计算精度,默认高精度。类型定义请参见aclComputeType

stream

输入

执行算子所在的Stream。类型定义请参见aclrtStream

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError

参考资源

接口调用流程,参见单算子调用流程