aclblasHgemv

产品支持情况

产品

是否支持

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

Atlas 200/300/500 推理产品

功能说明

执行矩阵-向量的乘法,y = αAx + βy,输入数据和输出数据的数据类型为aclFloat16

本接口是异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功。调用该接口后,需调用同步等待接口(例如,aclrtSynchronizeStream)确保任务已执行完成,否则可能会导致训练或推理等业务异常、Device断链掉卡等未知情况。

函数原型

aclError aclblasHgemv(aclTransType transA,
int m,
int n,
const aclFloat16 *alpha,
const aclFloat16 *a,
int lda,
const aclFloat16 *x,
int incx,
const aclFloat16 *beta,
aclFloat16 *y,
int incy,
aclComputeType type,
aclrtStream stream)

参数说明

参数名

输入/输出

说明

transA

输入

A矩阵是否转置的标记。

m

输入

矩阵A的行数,存储矩阵乘数据时,行优先。

n

输入

矩阵A的列数。

alpha

输入

用于执行乘操作的标量α的指针。

a

输入

矩阵A的指针。

lda

输入

A矩阵的主维,此时选择转置,按行优先,则lda为A的列数。预留参数,当前只能设置为-1。

x

输入

向量x的指针。

incx

输入

x连续元素之间的步长。

预留参数,当前只能设置为-1。

beta

输入

用于执行乘操作的标量β的指针。

y

输入&输出

向量y的指针。

incy

输入

y连续元素之间的步长。

预留参数,当前只能设置为-1。

type

输入

计算精度,默认高精度。

stream

输入

执行算子所在的Stream。

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError

参考资源

接口调用流程,参见单算子调用流程