vreducev2
功能说明
vreducev2指令抽象。
vreducev2指令根据输入y向量的mask数据,决定取x向量中的某些block级的元素存至z向量,由于msKPP中的tensor并无相关概念,因此增加了reserve_num的参数,z输出的shape由该参数决定。
接口原型
class vreducev2(x, y, z, reserve_num)
参数说明
参数名 |
输入/输出 |
数据类型 |
说明 |
|---|---|---|---|
x |
输入 |
tensor变量 |
输入x向量tensor。支持UINT16、UINT32。 |
y |
输入 |
tensor变量 |
输入y向量tensor。支持UINT16、UINT32。 |
z |
输出 |
tensor变量 |
输出z向量tensor。支持UINT16、UINT32。 |
reserve_num |
输入 |
int |
指定输出元素的个数。 |
使用示例
from mskpp import vreducev2, Tensor
ub_x, ub_y, ub_z = Tensor("UB"), Tensor("UB"), Tensor("UB")
gm_x, gm_y, gm_z = Tensor("GM"), Tensor("GM"), Tensor("GM")
reserve_num = 16
ub_x.load(gm_x)
ub_y.load(gm_y)
out = vreducev2(ub_x, ub_y, ub_z, reserve_num)()
gm_z.load(out[0])
父主题: msKPP对外接口使用说明