vcmax指令抽象。

计算输入的vector中的元素最大值。

class Vcmax(x, y, reduce_num)

参数名	输入/输出	数据类型	说明
x	输入	tensor变量	输入x向量tensor，支持FP16、FP32。
reduce_num	输入	int变量	指定最后一维reduce到多少倍，实测性能数据reduce对性能无影响。
y	输出	tensor变量	输出y向量tensor，支持FP16、FP32。

reduce_num不能为0。

ub_x, ub_y = Tensor("UB"), Tensor("UB")

reduce_num = 16

ub_x.load(gm_x)

out = vcmax(ub_x, ub_y, reduce_num)()