昇腾社区首页
中文
注册

函数:gemm_ex

产品支持情况

产品

是否支持

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas A2 训练系列产品 / Atlas 800I A2 推理产品 /A200I A2 Box 异构组件

Atlas 训练系列产品

Atlas 推理系列产品

Atlas 200I/500 A2 推理产品

Atlas 200/300/500 推理产品

功能说明

执行矩阵-矩阵的乘法,C = αAB + βC,输入数据、输出数据的数据类型通过入参设置,异步接口。

函数原型

  • C函数原型
     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    aclError aclblasGemmEx(aclTransType transA,
    aclTransType transB,
    aclTransType transC,
    int m,
    int n,
    int k,
    const void *alpha,
    const void *matrixA,
    int lda,
    aclDataType dataTypeA,
    const void *matrixB,
    int ldb,
    aclDataType dataTypeB,
    const void *beta,
    void *matrixC,
    int ldc,
    aclDataType dataTypeC,
    aclComputeType type,
    aclrtStream stream)
    
  • python函数
    1
    2
    3
    4
    5
    6
    ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c,
    m, n, k,
    alpha, matrix_a, lda, data_type_a,
    matrix_b, ldb, data_type_b,
    beta, matrix_c, ldc, data_type_c,
    type, stream)
    

参数说明

参数名

说明

trans_a

int,矩阵A是否转置的标记。

trans_b

int,B矩阵是否转置的标记。

trans_c

int,C矩阵的标记,当前仅支持aclTrans_N。

m

int,矩阵A的行数与矩阵C的行数。

n

int,矩阵B的列数与矩阵C的列数。

k

int,矩阵A的列数与矩阵B的行数。

alpha

int, 用于执行乘操作的标量alpha数据指针地址。

matrix_a

int,矩阵A的数据指针地址。

lda

int,A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

data_type_a

int,矩阵A的数据类型。

matrix_b

int,矩阵B的数据指针地址。

ldb

int,B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。预留参数,当前只能设置为-1。

data_type_b

int,矩阵B的数据类型。

beta

int,用于执行乘操作的标量beta的数据指针地址。

matrix_c

int,矩阵C的数据指针地址。

ldc

int,C矩阵的主维。预留参数,当前只能设置为-1。

data_type_c

int,矩阵C的数据类型。

type

int,计算精度。

stream

int,执行算子所在的Stream。

返回值说明

返回值

说明

ret

int,错误码,返回0表示成功,返回其它值表示失败。

约束说明

A、B、C的数据类型支持仅支持以下组合, α和β的数据类型与C一致。

A的数据类型

x的数据类型

y的数据类型

aclFloat16

aclFloat16

aclFloat16

aclFloat16

aclFloat16

float(float32)

int8_t

int8_t

float(float32)

int8_t

int8_t

int32_t

资源参考

接口调用流程、示例,参见接口调用流程