昇腾社区首页
中文
注册
开发者
下载
MS-Swift全面适配昇腾NPU,加速大模型技术创新与产业生态升级

MS-Swift全面适配昇腾NPU,加速大模型技术创新与产业生态升级

微调后训练MS-Swift

发表于 2026/01/28

什么是 MS-Swift?

MS-Swift(全称:Scalable lightWeight Infrastructure for FineTuning)是魔搭社区(ModelScope)推出的大语言模型与多模态大模型微调部署框架,堪称大模型开发者的"瑞士军刀"。其核心优势为:

1. 超全面的模型支持:支持600+纯文本大模型和300+多模态大模型;

2. 丰富的训练算法支持:支持多种轻量化微调和强化学习算法;

3. 多种训练后端支持:支持 DDP、DeepSpeed、FSDP、Megatron等多种训练后端;

4. 卓越的易用性:提供命令行、Python API、Web-UI三种使用方式,零代码即可上手。

MS-Swift 拥有活跃的开发者社区,GitHub 仓库持续更新,提供丰富的最佳实践案例与详尽技术文档。其开源协议为 Apache 2.0,支持私有化部署。MS-Swift 以其低门槛、高上限的特性,成为大模型微调领域的首选工具之一。


昇腾NPU × MS-Swift:强强联合,产业生态再升级

为更好地赋能大模型技术自主创新,满足开发者在昇腾NPU上进行大模型训练的需求,昇腾联合魔搭社区和头部金融机构技术团队,完成了MS-Swift框架对昇腾NPU的深度适配。

适配后,昇腾NPU全面支持MS-Swift框架下使用DDP、DeepSpeed、FSDP/FSDP2、Megatron等训练后端与vLLM推理后端,可进行CPT持续预训练、SFT监督微调、LoRA轻量化微调及RLHF、DPO等强化学习训练。同时,昇腾还联合社区、金融伙伴积极开发MS-Swift框架特性,贡献了NPU融合算子、LinearCrossEntropy、TiledMLP等特性,提升开箱性能与易用性。


精彩回顾!MS-Swift 首次线下 Meetup 圆满落幕

2026年1月17日,MS-Swift首次线下大模型训练Meetup成功举办。会上,昇腾、魔搭社区与金融行业合作伙伴联合发布了MS-Swift在昇腾NPU上的适配成果。此次适配实现了四大核心能力:自主创新,从硬件到框架全面实现自主创新;无缝迁移,原有MS-Swift代码零改动即可运行;生产级稳定,经过真实金融业务场景验证;社区活跃生态,持续更新且问题响应迅速。80余位开发者到场见证,现场交流氛围热烈!

昇腾计算训练领域高级工程师孙银磊在《昇腾开源训练软件栈:构筑与优化》专题分享中,介绍了昇腾在规模商用落地、SOTA模型孵化等领域取得的关键进展,重点讲解了昇腾支持MS-Swift等开源训练软件的实现方案,介绍了通过社区联创实现的开箱易用性与性能优化,并展望了对外开放、贡献更多特性、拥抱社区的未来规划。


立即体验 MS-Swift on 昇腾NPU,开启大模型训练之旅!

官方文档:https://swift.readthedocs.io/zh-cn/latest/BestPractices/NPU-support.html

NPU训练交流群:


本页内容