接口功能:基于一系列计算得到MHC架构中hidden层的和投影矩阵以及Attention或MLP层的输入矩阵。
计算公式:
每个算子分为,必须先调用"aclnnMhcPreGetWorkspaceSize"接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用"aclnnMhcPre"接口执行计算。
[object Object]
[object Object]
确定性计算:
- aclnnMhcPre默认确定性实现。
规格约束:
- n目前支持4、6、8。
- D支持1~16384范围以内,需满足D为16对齐。
[object Object]