函数：gemm_ex

产品支持情况

产品	是否支持
Atlas A3 训练系列产品 / Atlas A3 推理系列产品	√
Atlas A2 训练系列产品 / Atlas 800I A2 推理产品 /A200I A2 Box 异构组件	√
Atlas 训练系列产品	√
Atlas 推理系列产品	√
Atlas 200I/500 A2 推理产品	√
Atlas 200/300/500 推理产品	√

功能说明

执行矩阵-矩阵的乘法，C = αAB + βC，输入数据、输出数据的数据类型通过入参设置，异步接口。

函数原型

C函数原型

        
         
           
           
             aclError aclblasGemmEx(aclTransType transA,
aclTransType transB,
aclTransType transC,
int m,
int n,
int k,
const void *alpha,
const void *matrixA,
int lda,
aclDataType dataTypeA,
const void *matrixB,
int ldb,
aclDataType dataTypeB,
const void *beta,
void *matrixC,
int ldc,
aclDataType dataTypeC,
aclComputeType type,
aclrtStream stream)

            

          

        
       

python函数

        
             ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c,
m, n, k,
alpha, matrix_a, lda, data_type_a,
matrix_b, ldb, data_type_b,
beta, matrix_c, ldc, data_type_c,
type, stream)

参数说明

参数名	说明
trans_a	int，矩阵A是否转置的标记。
trans_b	int，B矩阵是否转置的标记。
trans_c	int，C矩阵的标记，当前仅支持aclTrans_N。
m	int，矩阵A的行数与矩阵C的行数。
n	int，矩阵B的列数与矩阵C的列数。
k	int，矩阵A的列数与矩阵B的行数。
alpha	int，用于执行乘操作的标量alpha数据指针地址。
matrix_a	int，矩阵A的数据指针地址。
lda	int，A矩阵的主维，此时选择转置，按行优先，则lda为A的列数。预留参数，当前只能设置为-1。
data_type_a	int，矩阵A的数据类型。
matrix_b	int，矩阵B的数据指针地址。
ldb	int，B矩阵的主维，此时选择转置，按行优先，则ldb为B的列数。预留参数，当前只能设置为-1。
data_type_b	int，矩阵B的数据类型。
beta	int，用于执行乘操作的标量beta的数据指针地址。
matrix_c	int，矩阵C的数据指针地址。
ldc	int，C矩阵的主维。预留参数，当前只能设置为-1。
data_type_c	int，矩阵C的数据类型。
type	int，计算精度。
stream	int，执行算子所在的Stream。

返回值说明

返回值	说明
ret	int，错误码，返回0表示成功，返回其它值表示失败。

约束说明

A、B、C的数据类型支持仅支持以下组合， α和β的数据类型与C一致。

A的数据类型	x的数据类型	y的数据类型
aclFloat16	aclFloat16	aclFloat16
aclFloat16	aclFloat16	float(float32)
int8_t	int8_t	float(float32)
int8_t	int8_t	int32_t

资源参考

接口调用流程、示例，参见接口调用流程。

父主题： CBLAS接口（blas）