昇腾社区首页
中文
注册

vcpadd

功能说明

获取元素对(元素n和元素n+1,n为偶数)的和。对于f16类型,结果连续128B(64个元素)写入目的地址。对于f32类型,结果连续128B(32个元素)写入目的地址。

流水类型

PIPE_V

类似指令

void vcpadd(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t srcRepeatStride);
void vcpadd(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t srcRepeatStride);
表1 vcpadd步长单位

数据类型

目的数据

源数据

数据块步长

重复步长

数据块步长

重复步长

f16

/

128B

32B

32B

f32

/

128B

32B

32B