LLM 后训练
1
课程
1
微认证
1小时
1854
本教程旨在通过理论解析与实战演练相结合的方式,指导开发者基于昇腾NPU平台,利用MindSpeed RL套件快速完成大模型强化学习后训练任务。
开始学习
MindSpeed RL强化学习全流程
1
完成路径
额外的成长积分
50积分预备知识
知识点
《MindSpeed RL强化学习全流程》
本课程系统介绍基于昇腾MindSpeed RL套件的大模型强化学习后训练全流程技术。
发布学习笔记,解答同学疑问,更有丰富奖励等你来参与
查看详情


