aclnnFlashAttentionScore

Atlas 训练系列产品不支持该算子。

Atlas A2 训练系列产品支持该算子。

接口原型

每个算子分为两段式接口,必须先调用“aclnnFlashAttentionScoreGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnFlashAttentionScore”接口执行计算。

功能描述

aclnnFlashAttentionScoreGetWorkspaceSize

aclnnFlashAttentionScore

约束与限制

关于数据shape的约束,以inputLayout的BSND、BNSD为例(BSH、SBH下H=N*D),其中: