aclnnGeluMul

产品支持情况

[object Object]undefined

功能说明

接口功能：

将输入Tensor按照最后一个维度分为左右两个Tensor：x1和x2，对左边的x1进行Gelu计算，将计算结果与x2相乘。
计算公式：

给定输入张量 [object Object]，最后一维的长度为 [object Object]，函数 [object Object] 进行以下计算：
1. 将 [object Object] 分割为两部分：
  $x_1 = \text{input}[..., :d], \quad x_2 = \text{input}[..., d:]$
2. 对x1应用GELU激活函数，"tanh"模式公式如下：
  $\text{GELU}(x) = 0.5 \cdot x \cdot \left( 1 + \tanh\left( \sqrt{\frac{2}{\pi}} \cdot \left( x + 0.044715 x^3 \right) \right) \right)$
  “none”对应的erf模式公式如下：
  $\text{GELU}(x) = 0.5 \cdot x \left( 1 + \text{erf}\left( \frac{x}{\sqrt{2}} \right) \right)$
  因此，计算：
  $x_1 = \text{GELU}(x_1)$
3. 最终输出是x1和x2的逐元素乘积：
  $\text{out} = x_1 \times x_2$

函数原型

每个算子分为，必须先调用“aclnnGeluMulGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小，再调用“aclnnGeluMul”接口执行计算。

[object Object]

[object Object]

aclnnGeluMulGetWorkspaceSize

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。第一段接口会完成入参校验，出现以下场景时报错：
[object Object]

aclnnGeluMul

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

约束说明

确定性计算：
- aclnnGeluMul默认确定性实现。
典型场景尾轴为16的倍数，当尾轴为非32B对齐时，建议走小算子拼接逻辑。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]