Expert Parallel-基础特性-特性介绍-MindIE LLM-大语言模型推理框架-MindIE3.0.0开发文档-昇腾社区

[object Object]

MoE类模型支持Expert Parallel（EP，专家并行），通过将专家分别部署在不同的设备上，实现专家级别的并行计算。

当前实现两种形式的EP并行：

[object Object]

[object Object]

开启Expert Parallel特性，需要配置的服务化参数如所示。

表 1 Expert Parallel特性补充参数：ModelConfig中的models参数 [object Object][object Object]

[object Object]undefined

[object Object]

“ep_level”=“2”时，使用样例：

[object Object]

[object Object]

“ep_level”=“1”时，长序列场景使用样例：

[object Object]