vcgmin
功能说明
vcgmin指令抽象
计算每个block的最小元素,共计8个block,不支持混合地址。
接口原型
class vcgmin(x, y, reduce_num)
参数说明
参数名  | 
输入/输出  | 
数据类型  | 
说明  | 
|---|---|---|---|
x  | 
输入  | 
tensor变量  | 
输入x向量tensor,支持FP16。  | 
y  | 
输出  | 
tensor变量  | 
输出y向量tensor,支持FP16。  | 
reduce_num  | 
输入  | 
int  | 
指定最后一维reduce到多少倍,实测性能数据reduce对性能无影响。  | 
约束说明
reduce_num不能为0。
使用示例
from mskpp import vcgmin, Tensor
ub_x, ub_y = Tensor("UB"), Tensor("UB")
gm_x = Tensor("GM")
reduce_num = 16
ub_x.load(gm_x)
out = vcgmin(ub_x, ub_y, reduce_num)()
父主题: msKPP对外接口使用说明