函数:gemm_ex
产品支持情况
产品 |
是否支持 |
---|---|
|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
功能说明
执行矩阵-矩阵的乘法,C = αAB + βC,输入数据、输出数据的数据类型通过入参设置,异步接口。
函数原型
- C函数原型
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
aclError aclblasGemmEx(aclTransType transA, aclTransType transB, aclTransType transC, int m, int n, int k, const void *alpha, const void *matrixA, int lda, aclDataType dataTypeA, const void *matrixB, int ldb, aclDataType dataTypeB, const void *beta, void *matrixC, int ldc, aclDataType dataTypeC, aclComputeType type, aclrtStream stream)
- python函数
1 2 3 4 5 6
ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c, m, n, k, alpha, matrix_a, lda, data_type_a, matrix_b, ldb, data_type_b, beta, matrix_c, ldc, data_type_c, type, stream)
参数说明
参数名 |
说明 |
---|---|
trans_a |
int,矩阵A是否转置的标记。 |
trans_b |
int,B矩阵是否转置的标记。 |
trans_c |
int,C矩阵的标记,当前仅支持aclTrans_N。 |
m |
int,矩阵A的行数与矩阵C的行数。 |
n |
int,矩阵B的列数与矩阵C的列数。 |
k |
int,矩阵A的列数与矩阵B的行数。 |
alpha |
int, 用于执行乘操作的标量alpha数据指针地址。 |
matrix_a |
int,矩阵A的数据指针地址。 |
lda |
int,A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。 |
data_type_a |
int,矩阵A的数据类型。 |
matrix_b |
int,矩阵B的数据指针地址。 |
ldb |
int,B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。预留参数,当前只能设置为-1。 |
data_type_b |
int,矩阵B的数据类型。 |
beta |
int,用于执行乘操作的标量beta的数据指针地址。 |
matrix_c |
int,矩阵C的数据指针地址。 |
ldc |
int,C矩阵的主维。预留参数,当前只能设置为-1。 |
data_type_c |
int,矩阵C的数据类型。 |
type |
int,计算精度。 |
stream |
int,执行算子所在的Stream。 |
返回值说明
返回值 |
说明 |
---|---|
ret |
int,错误码,返回0表示成功,返回其它值表示失败。 |
约束说明
A、B、C的数据类型支持仅支持以下组合, α和β的数据类型与C一致。
A的数据类型 |
x的数据类型 |
y的数据类型 |
---|---|---|
aclFloat16 |
aclFloat16 |
aclFloat16 |
aclFloat16 |
aclFloat16 |
float(float32) |
int8_t |
int8_t |
float(float32) |
int8_t |
int8_t |
int32_t |