(beta)torch_npu.contrib.function.matmul_transpose
接口原型
matmul_transpose(torch.autograd.Function):
功能描述
使用NPU自定义算子替换原生写法,以提高性能。
参数说明
- tensor1 (Tensor) - 第一个要乘的张量
- tensor2 (Tensor) - 第二个要乘的张量
输出说明
Tensor - 输出张量
约束说明
在动态shape场景中,由于算子限制,不支持Box transformation deltas。
调用示例
调用方式示例:
from torch_npu.contrib.function import matmul_transpose output = matmul_transpose(tensor1, tensor2)
使用示例:
>>> tensor1 = torch.randn(68, 5, 75, 16).npu() >>> tensor1.requires_grad_(True) >>> tensor2 = torch.randn(68, 5, 75, 16).npu() >>> tensor2.requires_grad_(True) >>> output = matmul_transpose(tensor1, tensor2) >>> output.sum().backward()
父主题: torch_npu.contrib