昇腾社区首页
中文
注册

vrsqrt

功能说明

以block(32Byte)为单位完成以下计算,一次完成8个block的计算。

[dst] = 1/sqrt([src])

函数原型

void vrsqrt(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t dstRepeatStride, uint16_t srcRepeatStride); 
void vrsqrt(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t dstRepeatStride, uint16_t srcRepeatStride);

流水类型

PIPE_V