aclnnQuantFlashAttentionScoreGrad-Transformer类接口-算子接口（aclnn）-算子库接口-API-CANN社区版9.0.0-beta.2开发文档-昇腾社区

[object Object][object Object][object Object]undefined

[object Object]

[object Object]

每个算子分为，必须先调用“aclnnQuantFlashAttentionScoreGradGetWorkspace”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnQuantFlashAttentionScoreGrad”接口执行计算。

[object Object]

[object Object]

[object Object]

确定性计算：
- aclnnQuantFlashAttentionScoreGrad默认确定性实现。
输入query、key、value、dy的约束如下：
- B：batchsize必须相等。
- inputLayout必须一致。
- D：支持128。
输入query/dy的N和key/value的N必须相等。
关于数据shape的约束，目前支持以下场景：
[object Object]
部分场景下，如果计算量过大可能会导致算子执行超时(aicore error类型报错，errorStr为：timeout or trap error)，此时建议做轴切分处理，注：这里的计算量会受B、S、N、D等参数的影响，值越大计算量越大。
关于softmaxMax与softmaxSum参数的约束：输入格式固定为[B, N, S, 1]。
headNum的取值必须和传入的Query中的N值保持一致。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]