vcpadd
功能说明
获取元素对(元素n和元素n+1,n为偶数)的和。对于f16类型,结果连续128B(64个元素)写入目的地址。对于f32类型,结果连续128B(32个元素)写入目的地址。
流水类型
PIPE_V
类似指令
void vcpadd(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t srcRepeatStride); void vcpadd(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstBlockStride, uint16_t srcBlockStride, uint16_t srcRepeatStride);
数据类型 |
目的数据 |
源数据 |
||
---|---|---|---|---|
数据块步长 |
重复步长 |
数据块步长 |
重复步长 |
|
f16 |
/ |
128B |
32B |
32B |
f32 |
/ |
128B |
32B |
32B |
父主题: 规约运算