将tensor_0中每个元素乘上tensor_2中的对应元素,再加上tensor_1中的对应元素,然后做线性整流,对应的计算为relu(tensor_0 * tensor_2 + tensor_1)。
您可以在“te/lang/cce/te_compute/elewise_compute.py”查看接口定义。
三个tensor的数据类型要求一致。
Atlas 200/300/500 推理产品:支持的数据类型有float16、float32
Atlas 训练系列产品:支持的数据类型有float16、float32
te.lang.cce.vmaddrelu(tensor_0, tensor_1, tensor_2)
Atlas 200/300/500 推理产品
Atlas 训练系列产品
res_tensor:结果tensor,tvm.tensor类型。
shape = (1024,1024) input_dtype = "float16" data1 = tvm.placeholder(shape, name="data1", dtype=input_dtype) data2 = tvm.placeholder(shape, name="data2", dtype=input_dtype) data3 = tvm.placeholder(shape, name="data3", dtype=input_dtype) res = te.lang.cce.vmaddrelu(data1, data2, data3)