下载
EN
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

vcgadd

功能说明

vcgadd指令抽象

计算每个block元素的和,共计8个block,不支持混合地址。

接口原型

class vcgadd(x, y, reduce_num)

参数说明

参数名

输入/输出

数据类型

说明

x

输入

tensor变量

输入x向量tensor,支持FP16、FP32。

y

输出

tensor变量

输出y向量tensor,支持FP16、FP32。

reduce_num

输入

int

shape指定的缩减倍数。

约束说明

reduce_num不能为0。

使用示例

1
2
3
4
5
6
from mskpp import vcgadd, Tensor
ub_x, ub_y = Tensor("UB"), Tensor("UB")
gm_x = Tensor("GM")
reduce_num = 16
ub_x.load(gm_x)
out = vcgadd(ub_x, ub_y, reduce_num)()
搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词