vrec
功能说明
计算每个向量元素近似的倒数估计值,公式如下:
[dst] = 1 / [src]
src 应不为0,否则会导致未知结果并引发异常。
该接口的行为与 ARM v8.2 接口 FRECPE 相同。
以 block(32Byte)为单位完成计算,一次完成8个block 的计算。
该接口支持通过MASK控制哪些元素参与计算。
接口原型
// 相同接口的不同原型区别在于源地址和目的地址的数据类型不同。 void vrec(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t dstRepeatStride, uint16_t srcRepeatStride); void vrec(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t dstRepeatStride, uint16_t srcRepeatStride);
参数说明
参数含义见 表1 单目运算参数说明。
流水类型
PIPE_V
父主题: 单目运算