开发者
资源
[object Object]

[object Object][object Object]undefined
[object Object]
  • 接口功能:执行单路旋转位置编码计算。

  • 计算公式:

    • [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:

    (1)half模式(mode等于0):

    x1=x[...,:x.shape[1]//2]x1 = x[..., : x.shape[-1] // 2] x2=x[...,x.shape[1]//2:]x2 = x[..., x.shape[-1] // 2 :] x_rotate=torch.cat((x2,x1),dim=1)x\_rotate = torch.cat((-x2, x1), dim=-1) y=xcos+x_rotatesiny = x * cos + x\_rotate * sin

    (2)interleave模式(mode等于1):

    x1=x[...,::2].view(1,1)x1 = x[..., ::2].view(-1, 1) x2=x[...,1::2].view(1,1)x2 = x[..., 1::2].view(-1, 1) x_rotate=torch.cat((x2,x1),dim=1).view(x.shape[0],x.shape[1],x.shape[2],x.shape[3])x\_rotate = torch.cat((-x2, x1), dim=-1).view(x.shape[0], x.shape[1], x.shape[2], x.shape[3]) y=xcos+x_rotatesiny = x * cos + x\_rotate * sin

    (3)quarter模式(mode等于2):

    x1=x[...,:x.shape[1]//4]x1 = x[..., : x.shape[-1] // 4] x2=x[...,x.shape[1]//4:x.shape[1]//2]x2 = x[..., x.shape[-1] // 4 : x.shape[-1] // 2] x3=x[...,x.shape[1]//2:x.shape[1]//43]x3 = x[..., x.shape[-1] // 2 : x.shape[-1] // 4 * 3] x4=x[...,x.shape[1]//43:]x4 = x[..., x.shape[-1] // 4 * 3 :] x_rotate=torch.cat((x2,x1,x4,x3),dim=1)x\_rotate = torch.cat((-x2, x1, -x4, x3), dim=-1) y=xcos+x_rotatesiny = x * cos + x\_rotate * sin

    (4)interleave-half模式(mode等于3),该模式会先将奇数位的输入抽取到前半部分,将偶数位的输入抽取到后半部分,再进行half处理:

    x1=x[...,::2]x1 = x[..., ::2] x2=x[...,1::2]x2 = x[..., 1::2] x_part1=torch.cat((x1,x2),dim=1)x\_part1 = torch.cat((x1, x2), dim=-1) x_part2=torch.cat((x2,x1),dim=1)x\_part2 = torch.cat((-x2, x1), dim=-1) y=x_part1cos+x_part2siny = x\_part1 * cos + x\_part2 * sin
[object Object]

每个算子分为,必须先调用“aclnnRotaryPositionEmbeddingGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小,再调用“aclnnRotaryPositionEmbedding”接口执行计算。

[object Object]
[object Object]
[object Object]
  • 参数说明

    [object Object]
    • [object Object]Atlas 推理系列产品[object Object]:不支持BFLOAT16数据类型

    • 参数mode约束:

      • [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:0=half,1=interleave。
      • Atlas 350 加速卡:2=quarter,3=interleave-half。
      • [object Object]Atlas 推理系列产品[object Object]:0=half。
  • 返回值:

    返回aclnnStatus状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]
[object Object]
  • 参数说明:

    [object Object]
  • 返回值:

    返回aclnnStatus状态码,具体参见

[object Object]
  • 确定性计算:
    • aclnnRotaryPositionEmbedding默认确定性实现。

    • Atlas 350 加速卡:

      输入张量x共有四维,各参数的shape约束可以描述如下:

      • 输入张量x、cos、sin及输出张量y的最后一维大小必须相同,且小于等于1024。对于half、interleave和interleave-half模式,最后一维必须能被2整除,对于quarter模式,最后一维必须能被4整除。
      • 输入张量x和输出张量y的shape必须完全相同。
      • 输入张量cos和sin的shape必须完全相同,cos和sin的shape需要与x满足,且广播后的shape必须等于x的shape。
    • [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:

      输入张量x支持BNSD、BSND、SBND、TND排布。 输入张量x、cos、sin及输出张量y的D维度大小必须相同,满足D<896,且必须为2的倍数。 输入张量x和输出张量y的shape必须完全相同。 输入张量cos和sin的shape必须完全相同.

      • half模式:
        • B,N < 1000;
        • 当x为BNSD时,cos、sin支持11SD、B1SD、BNSD
          • 当(D/2)% (32/inputDtypeSize) == 0时,需满足B * N <= S * 8
          • 当(D/2)% (32/inputDtypeSize) != 0时,需满足B * N * 2 <= (S + coreNum -1) / coreNum 或者 D >= 80
        • 当x为BSND时,cos、sin支持1S1D、BS1D、BSND
        • 当x为SBND时,cos、sin支持S11D、SB1D、SBND
        • 当x为TND时,cos、sin支持T1D、TND
      • interleave模式:
        • B * N < 1000(N<1000当x为TND)
        • 当x为BNSD时,cos、sin支持11SD
        • 当x为BSND时,cos、sin支持1S1D
        • 当x为SBND时,cos、sin支持S11D
        • 当x为TND时,cos、sin支持T1D
    • [object Object]Atlas 推理系列产品[object Object]:

      输入张量x支持BNSD、BSND、SBND、TND排布。 输入张量x、cos、sin及输出张量y的D维度大小必须相同,满足D<=128,且必须为32的倍数。 输入张量x和输出张量y的shape必须完全相同。 输入张量cos和sin的shape必须完全相同。

      • 仅支持half模式:
        • B,N < 1000
        • 当x为BNSD时,cos、sin支持11SD、B1SD、BNSD
          • B * N <= S * 8
        • 当x为BSND时,cos、sin支持1S1D、BS1D、BSND
        • 当x为SBND时,cos、sin支持S11D、SB1D、SBND
        • 当x为TND时,cos、sin支持T1D、TND
[object Object]

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]