aclnnPromptFlashAttentionV2

Atlas 训练系列产品不支持该算子。

Atlas A2训练系列产品支持该算子。

接口原型

每个算子分为两段式接口,必须先调用“aclnnPromptFlashAttentionV2GetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnPromptFlashAttentionV2”接口执行计算。

功能描述

aclnnPromptFlashAttentionV2GetWorkspaceSize

aclnnPromptFlashAttentionV2

约束与限制