昇腾社区首页
中文
注册

特性列表

为确保MindSpeed在昇腾设备上实现大模型训练的全方位加速与优化,以下特性列表概述了关键功能与优势,旨在从计算性能、内存资源、通信性能、并行算法以及差异化能力支持等多个维度,全面提升大模型训练的效率与稳定性。

  • 目前MindSpeed支持Megatron MoE和Deepspeed MoE两种实现,可通过如下参数进行配置。
    --moe-model-type deepspeed_moe      # 使用DeepSpeed MoE实现方案
    --moe-model-type megatron_moe       # 使用Megatron MoE实现方案
  • Mcore为当前主要演进分支,推荐使用。Mcore相较于Legacy,采用更加解耦和模块化的设计,提供更灵活的接口和底层功能,特别适合需要自定义训练过程的用户。
  • Legacy以功能维护为主,不继续演进。