aclnnFusedLinearOnlineMaxSum
产品支持情况
功能说明
接口功能:
功能等价Megatron的matmul与fused_vocab_parallel_cross_entropy的实现,支持vocabulary_size维度切卡融合matmul与celoss,中间根据通信拆分为、,需要依次调用实现完整功能。
计算公式:
与做矩阵乘得到:
计算每行的最大值:
计算与的差值:
计算经过指数运算后每行的和
计算小于或大于的mask
计算
计算
计算
其中。
函数原型
每个算子分为,必须先调用“aclnnFusedLinearOnlineMaxSumGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnFusedLinearOnlineMaxSum”接口执行计算。
[object Object]
[object Object]
aclnnFusedLinearOnlineMaxSumGetWorkspaceSize
aclnnFusedLinearOnlineMaxSum
约束说明
- 确定性说明:
- [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]:aclnnFusedLinearOnlineMaxSum默认确定性实现。
调用示例
[object Object]