昇腾社区首页
中文
注册

新增特性

组件

描述

目的

MindSpeed LLM

新增模型支持

发布DeepSeek-V3、DeepSeek-R1-Distill以及HunyuanLarge系列模型。

后训练算法支持

Qwen2.5全参微调与lora微调支持,支持QLoRA微调训练。

MindSpeed MM

新增模型支持

新增支持SD3.5、CogvideoX1.5、Hunyuan Video、InternVL2.5、InternVL2、Qwen2VL等模型。

Qwen2VL系列模型适配

Qwen2VL 72B支持LoRA、DPO。

Qwen2VL 7B支持视频理解。

生成模型并行能力增强

OpenSoraPlan1.3模型支持USP、VPP、VAE-CP、Encoder-DP。

CogVideoX 5B模型支持分层zero、Encoder-DP、VAE-CP。

理解模型并行能力增强

Qwen2VL 72B支持非对齐SP和CP。

框架优化

多模态理解任务训练入口统一,多模态生成任务新增数据集断点续训功能。

MindSpeed Core

兼容Megatron-LM core_r0.8.0

从计算性能、内存资源、通信性能及并行算法等多个维度,全面提升大模型训练的效率与稳定性。

新增支持自适应HCCL Buffer

新增支持非对齐TP、SP、Ulysses CP