函数:gemm_ex
产品支持情况
| 
          产品  | 
        
          是否支持  | 
       
|---|---|
| 
          | 
        
          √  | 
       
| 
          | 
        
          √  | 
       
| 
          | 
        
          √  | 
       
| 
          | 
        
          √  | 
       
| 
          | 
        
          √  | 
       
| 
          | 
        
          √  | 
       
使用说明
| 
          C函数原型  | 
        
          aclError aclblasGemmEx(aclTransType transA, aclTransType transB, aclTransType transC, int m, int n, int k, const void *alpha, const void *matrixA, int lda, aclDataType dataTypeA, const void *matrixB, int ldb, aclDataType dataTypeB, const void *beta, void *matrixC, int ldc, aclDataType dataTypeC, aclComputeType type, aclrtStream stream)  | 
       
|---|---|
| 
          Python函数  | 
        
          ret = acl.blas.gemm_ex(trans_a, trans_b, trans_c, m, n, k, alpha, matrix_a, lda, data_type_a, matrix_b, ldb, data_type_b, beta, matrix_c, ldc, data_type_c, type, stream)  | 
       
| 
          函数功能  | 
        
          执行矩阵-矩阵的乘法,C = αAB + βC,输入数据、输出数据的数据类型通过入参设置,异步接口。  | 
       
| 
          输入说明  | 
        
          trans_a:int,矩阵A是否转置的标记。 trans_b:int,B矩阵是否转置的标记。 trans_c:int,C矩阵的标记,当前仅支持aclTrans_N。 m:int,矩阵A的行数与矩阵C的行数。 n:int,矩阵B的列数与矩阵C的列数。 k:int,矩阵A的列数与矩阵B的行数。 alpha:int, 用于执行乘操作的标量alpha数据指针地址。 matrix_a:int,矩阵A的数据指针地址。 lda:int,A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。 data_type_a:int,矩阵A的数据类型。 matrix_b:int,矩阵B的数据指针地址。 ldb:int,B矩阵的主维,此时选择转置,按行优先,则ldb为B的列数。预留参数,当前只能设置为-1。 data_type_b:int,矩阵B的数据类型。 beta:int,用于执行乘操作的标量beta的数据指针地址。 matrix_c:int,矩阵C的数据指针地址。 ldc:int,C矩阵的主维。预留参数,当前只能设置为-1。 data_type_c:int,矩阵C的数据类型。 type:int,计算精度。 stream:int,执行算子所在的Stream。  | 
       
| 
          返回值说明  | 
        
          ret:int,错误码。 
  | 
       
| 
          约束说明  | 
        
          A、B、C的数据类型支持仅支持以下组合, α和β的数据类型与C一致。 A的数据类型 x的数据类型 y的数据类型 aclFloat16 aclFloat16 aclFloat16 aclFloat16 aclFloat16 float(float32) int8_t int8_t float(float32) int8_t int8_t int32_t  | 
       
| 
          参考资源  |