torch_npu.npu_moe_re_routing

功能描述

接口原型

torch_npu.npu_moe_re_routing(Tensor tokens, Tensor expert_token_num_per_rank, *, Tensor? per_token_scales=None, int expert_token_num_type=1, int idx_type=0) -> (Tensor, Tensor, Tensor, Tensor)

参数说明

Tensor中shape使用的变量说明:

  • A:表示token个数,取值要求Sum(expert_token_num_per_rank)=A。
  • H:表示token长度,取值要求0<H<16384。
  • N:表示卡数,取值无限制。
  • E:表示卡上的专家数,取值无限制。

输出说明

约束说明

支持的型号

调用示例