昇腾社区首页
中文
注册

vcadd

功能说明

以block(32Byte)为单位完成向量的累加,每次迭代计算结果为8个block(256Byte)的累加值。

函数原型

void vcadd(__ubuf__ half *dst, __ubuf__ half *src, uint8_t repeat, uint16_t dstRepeatStride, uint16_t srcBlockStride, uint16_t srcRepeatStride, bool mode);
void vcadd(__ubuf__ float *dst, __ubuf__ float *src, uint8_t repeat, uint16_t dstRepeatStride, uint16_t srcBlockStride, uint16_t srcRepeatStride, bool mode);

参数说明

表1 vcadd特有参数说明

参数名

说明

取值范围

mode

  • 为false时,计算结果会输出到当前迭代的目的地址。
  • 为true时,会计算所有迭代的累加结果,该结果可通过int64_t get_acc_val()接口获取。

[0, 1]

流水类型

PIPE_V