vcadd
功能说明
以block(32Byte)为单位完成向量的累加,每次迭代计算结果为8个block(256Byte)的累加值。
函数原型
void vcadd(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstRepeatStride, uint16_t srcBlockStride, uint16_t srcRepeatStride, bool mode); void vcadd(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstRepeatStride, uint16_t srcBlockStride, uint16_t srcRepeatStride, bool mode);
参数说明
参数名 |
说明 |
取值范围 |
---|---|---|
mode |
|
[0, 1] |
流水类型
PIPE_V
父主题: 规约运算