vcmp_xxx
功能说明
vcmp_[eq|ge|gt|le|lt|ne]指令抽象,该六条指令性能一致。
vcmp_eq: z = (x == y), x、y 按元素比较相等得到z。
vcmp_ge: z = (x >= y), x、y 按元素比较大于或等于得到z。
vcmp_gt: z = (x > y), x、y 按元素比较大于得到z。
vcmp_le: z = (x <= y), x、y 按元素比较小于或等于得到z。
vcmp_lt: z = (x < y), x、y 按元素比较小于得到z。
vcmp_ne: z = (x != y), x、y 按元素比较不等得到z。
接口原型
class vcmp(x, y, z)
参数说明
参数名 |
输入/输出 |
数据类型 |
说明 |
---|---|---|---|
x |
输入 |
tensor变量 |
输入x向量tensor,支持FP16、FP32。 |
y |
输入 |
tensor变量 |
输入y向量tensor,支持FP16、FP32。 |
z |
输出 |
tensor变量 |
输出向量tensor。 |
约束说明
vector指令所有输入输出数据的tensor均在“UB”空间中,shape需保持一致。
使用示例
from mskpp import vcmp, Tensor ub_x, ub_y, ub_z = Tensor("UB"), Tensor("UB"), Tensor("UB") gm_x, gm_y = Tensor("GM"), Tensor("GM") ub_x.load(gm_x) ub_y.load(gm_y) out = vcmp(ub_x, ub_y, ub_z)()
父主题: msKPP对外接口使用说明