vcmpvs_x

函数功能

vcmpvs_[eq|ge|gt|le|lt|ne]指令抽象,该六条指令性能一致。

vcmpvs_eq: z = (x == y), x逐元素与y中存储的标量比较相等得到z。

vcmpvs_ge: z = (x >= y), x逐元素与y中存储的标量比较大于或等于得到z。

vcmpvs_gt: z = (x > y),x逐元素与y中存储的标量比较大于得到z。

vcmpvs_le: z = (x <= y), x逐元素与y中存储的标量比较小于或等于得到z。

vcmpvs_lt: z = (x < y), x逐元素与y中存储的标量比较小于得到z。

vcmpvs_ne: z = (x != y), x逐元素与y中存储的标量比较不等得到z。

函数原型

class Vcmpvs(x, y, z)

参数说明

参数名

输入/输出

数据类型

说明

x

输入

tensor变量

输入x向量tensor,支持FP16,FP32。

y

输入

tensor变量

输入y向量tensor,支持FP16,FP32。

z

输出

tensor变量

输出向量tensor。

约束说明

vector指令所有输入输出数据的tensor均在“UB”空间中,shape需保持一致。

使用示例

ub_x, ub_y, ub_z = Tensor("UB"), Tensor("UB"), Tensor("UB")
ub_x.load(gm_x)
ub_y.load(gm_y)
out = vcmpvs(ub_x, ub_y, ub_z)()