vcpadd指令抽象。
计算输入的x向量的n和n+1的和,n为偶数下标,将结果写回y。reduce_num控制了输出的type。
class Vcpadd(x, y, reduce_num)
参数名 |
输入/输出 |
数据类型 |
说明 |
---|---|---|---|
x |
输入 |
tensor变量 |
输入x向量tensor。支持fp16、fp32。 |
reduce_num |
输入 |
int变量 |
shape指定的缩减倍数。 |
y |
输出 |
tensor变量 |
输出y向量tensor。支持fp16、fp32。 |
ub_x, ub_y = Tensor("UB"), Tensor("UB") ub_x.load(gm_x) ub_y.load(gm_y) out = vcpadd(ub_x, ub_y, reduce_num)()