aclnnPromptFlashAttention

Atlas 训练系列产品不支持该算子。

Atlas A2训练系列产品支持该算子。

接口原型

每个算子分为两段式接口,必须先调用“aclnnPromptFlashAttentionGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnPromptFlashAttention”接口执行计算。

功能描述

aclnnPromptFlashAttentionGetWorkspaceSize

aclnnPromptFlashAttention

约束与限制