昇腾社区首页
中文
注册
开发者
下载

vmaddrelu

功能说明

计算源数据和目的数据逐元素相乘后再与另一个源数据相加后施加 ReLU 函数,计算公式如下:

[dst] = ReLU([src0] * [dst] + [src1])

以 block(32Byte)为单位完成计算,一次完成8个block 的计算。

该接口支持通过MASK控制哪些元素参与计算。

接口原型

// 相同接口的不同原型区别在于源地址和目的地址的数据类型不同。
void vmaddrelu(__ubuf__ half *dst, __ubuf__ half *src0, __ubuf__ half *src1, uint8_t repeat, uint8_t dstBlockStride, uint8_t src0BlockStride, uint8_t src1BlockStride, uint8_t dstRepeatStride, uint8_t src0RepeatStride, uint8_t src1RepeatStride); 
 
void vmaddrelu(__ubuf__ float *dst, __ubuf__ float *src0, __ubuf__ float *src1, uint8_t repeat, uint8_t dstBlockStride, uint8_t src0BlockStride, uint8_t src1BlockStride, uint8_t dstRepeatStride, uint8_t src0RepeatStride, uint8_t src1RepeatStride);

参数说明

参数含义见 表2 双目运算参数说明

流水类型

PIPE_V