接口功能:MhcPreBackward是MhcPre的反向算子,MhcPre算子基于一系列计算得到mHC(Manifold-Constrained Hyper-Connections)架构中的和投影矩阵以及Atten或MLP层的输入矩阵
计算公式:
输出组合梯度计算
- 正向公式:
- 反向计算:
Sigmoid门控反向(H_pre)
- 正向公式:
- 反向计算:
Sigmoid门控反向(H_post)
- 正向公式:
- 反向计算:
残差连接反向(H_res)
- 正向公式:
- 反向计算:
RMSNorm Fusion反向
- 正向公式:
- 反向计算:
矩阵乘法反向
- 正向公式:
- 反向计算:
特征缩放反向
- 正向公式:
- 反向计算:
RMS归一化梯度计算
- 正向公式:
- 反向计算:
融合mhc_post的grad_x相加操作
每个算子分为,必须先调用“aclnnMhcPreBackwardGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMhcPreBackward”接口执行计算。
[object Object]
[object Object]
确定性计算:
- aclnnMhcPreBackward默认采用确定性实现。
规格约束
[object Object]
[object Object]