- 接口功能:基于一系列计算得到MHC架构中hidden层的和投影矩阵以及Attention或MLP层的输入矩阵。对矩阵执行Sinkhorn迭代归一化变换,最终得到双随机矩阵;支持输出中间计算结果,用于反向梯度计算。包括sigmoid计算之后的矩阵、与矩阵乘的结果,输入x的RmsNorm结果、迭代过程中的中间归一化结果和和求和结果。
- 计算公式
将作为输入,Sinkhorn变换共执行次迭代,迭代过程中生成中间归一化结果和求和结果,最终输出最后一次迭代的作为变换结果。
第一次迭代(初始化):
第次迭代():
最终输出
符号说明
[object Object]undefined
每个算子分为,必须先调用[object Object]接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用[object Object]执行实际计算。
[object Object]
[object Object]
确定性计算
- aclnnMhcPreSinkhorn默认采用确定性实现,相同输入多次调用结果一致。
规格约束
[object Object]undefined
[object Object]