aclnnIncreFlashAttention

Atlas 训练系列产品不支持该算子。

Atlas A2训练系列产品支持该算子。

接口原型

每个算子分为两段式接口,必须先调用“aclnnIncreFlashAttentionGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnIncreFlashAttention”接口执行计算。

功能描述

aclnnIncreFlashAttentionGetWorkspaceSize

aclnnIncreFlashAttention

约束与限制