vmla

功能说明

将tensor_0中每个元素乘上tensor_1中的对应元素,再加上tensor_2中的对应元素,对应的计算为tensor_0 * tensor_1 + tensor_2。

您可以在“te/lang/cce/te_compute/elewise_compute.py”查看接口定义。

约束说明

三个tensor的数据类型要求一致,shape需相同。

Atlas 200/300/500 推理产品:支持的数据类型有float16、float32

Atlas 训练系列产品:支持的数据类型有float16、float32

函数原型

te.lang.cce.vmla(tensor_0, tensor_1, tensor_2)

参数说明

返回值

res_tensor:表示tensor_0 * tensor_1 + tensor_2,tvm.tensor类型。

支持的芯片型号

Atlas 200/300/500 推理产品

Atlas 训练系列产品

调用示例

shape = (1024,1024)
input_dtype = "float16"
data1 = tvm.placeholder(shape, name="data1", dtype=input_dtype)
data2 = tvm.placeholder(shape, name="data2", dtype=input_dtype)
data3 = tvm.placeholder(shape, name="data3", dtype=input_dtype)
res = te.lang.cce.vmla(data1, data2, data3)