下载
中文
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

vcgmin

功能说明

vcgmin指令抽象

计算每个block的最小元素,共计8个block,不支持混合地址。

接口原型

class vcgmin(x, y, reduce_num)

参数说明

参数名

输入/输出

数据类型

说明

x

输入

tensor变量

输入x向量tensor,支持FP16。

y

输出

tensor变量

输出y向量tensor,支持FP16。

reduce_num

输入

int

指定最后一维reduce到多少倍,实测性能数据reduce对性能无影响。

约束说明

reduce_num不能为0。

使用示例

1
2
3
4
5
6
from mskpp import vcgmin, Tensor
ub_x, ub_y = Tensor("UB"), Tensor("UB")
gm_x = Tensor("GM")
reduce_num = 16
ub_x.load(gm_x)
out = vcgmin(ub_x, ub_y, reduce_num)()
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词