aclnnRotaryPositionEmbeddingGrad
产品支持情况
功能说明
计算公式:
取旋转位置编码的正向计算中,broadcast的轴列表为
[object Object],则计算公式可表达如下:- [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:
(1)half模式(mode等于0):
(2)interleave模式(mode等于1):
(3)quarter模式(mode等于2):
(4)interleave-half模式(mode等于3):
函数原型
每个算子分为,必须先调用“aclnnRotaryPositionEmbeddingGradGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小,再调用“aclnnRotaryPositionEmbeddingGrad”接口执行计算。
[object Object]
[object Object]
aclnnRotaryPositionEmbeddingGradGetWorkspaceSize
参数说明
[object Object]- 参数mode约束:
- [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:0=half,1=interleave。
- 参数mode约束:
返回值:
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnRotaryPositionEmbeddingGrad
约束说明
- 确定性计算:
aclnnRotaryPositionEmbeddingGrad默认确定性实现。
[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:
- 输入张量dy支持BNSD、BSND、SBND、TND排布。
- 输入张量dy、cos、sin、xOptional及输出张量dxOut、dcosOut、dsinOut的D维度大小必须相同,满足D<896,且必须为2的倍数。
- 输入张量dy、xOptional和输出张量dxOut的shape必须完全相同。
- 输入张量cos、sin和输出张量dcosOut、dsinOut的shape必须完全相同,且cos和sin的shape必须完全相同。
- half模式:
- B,N < 1000;当需要计算dsin、dcos时,B * N <= 1024
- 当dy为BNSD时,cos、sin支持11SD、B1SD、BNSD;当cos、sin为B1SD时需满足B < S
- 当dy为BSND时,cos、sin支持1S1D、BS1D、BSND;当cos、sin为BS1D时需满足B < S
- 当dy为SBND时,cos、sin支持S11D、SB1D、SBND
- 当dy为TND时,cos、sin支持T1D、TND
- interleave模式:
- B * N < 1000(N < 1000当dy为TND时)
- 当dy为BNSD时,cos、sin支持11SD
- 当dy为BSND时,cos、sin支持1S1D
- 当dy为SBND时,cos、sin支持S11D
- 当dy为TND时,cos、sin支持T1D
调用示例
[object Object]