昇腾社区首页
中文
注册
开发者
下载

学习路径

应用开发者
涵盖推理生产环境部署、RAG系列教程、Diffusion文生图系列教程等内容
模型开发者
涵盖CV/LLM等典型模型微调、LLM大模型开发全流程等内容
加速库开发者
涵盖PTAdapter原理与架构、MindSpeed-LLM原理与架构等内容
算子开发者
涵盖CANN基础架构与极简科普、Ascend C算子开发系列教程等内容

学习资源

课程
昇腾MindSpeed RL框架代码解析
--
26分钟
4
本课程系统介绍基于昇腾MindSpeed RL套件的核心特性代码实现,内容涵盖训推共卡、全共卡、TransferDock数据调度、数据并行负载均衡、Partial Rollout、Remove Padding和动态批大小,并包含完整的实操演练。课程旨在帮助学员深入理解框架架构与关键特性实现原理,掌握使用MindSpeed RL套件进行大规模强化学习训练优化的工程实践能力,从而具备在企业级场景中高效提升训练效率与降低资源成本的能力。 第一章:MindSpeed RL整体架构简介 第二章:MindSpeed RL代码框架简介 第三章:训推共卡 第四章:全共卡 第五章:TransferDock 第六章:数据并行负载均衡 第七章:Partial Rollout 第八章:Remove Padding 第九章:动态批大小 为了更高效、准确地传递课程内容,我们采用了语音合成技术,降低人工录制环节的不确定性。目前AI语音可能还不够完美,我们将努力优化播讲效果,力求给您更好的学习体验,同时也欢迎大家推荐更好用的语音合成引擎——您的声音对我们非常重要!
课程
CATLASS算子开发(进阶)
5.0
0分钟
17
本课程为CATLASS算子开发系列的进阶课程,聚焦于CATLASS算子模板库的实战开发。课程以Basic Matmul算子为切入点,系统讲解其设计思路与代码实现,帮助开发者掌握基于CATLASS模板库构建高性能矩阵乘算子的方法。课程内容涵盖算子的架构设计、代码组装流程、性能调优策略及典型调用方式,旨在提升开发者在昇腾硬件上实现高性能自定义算子的能力。 为了更高效、准确地传递课程内容,我们采用了语音合成技术,降低人工录制环节的不确定性。目前AI语音可能还不够完美,我们将努力优化播讲效果,力求给您更好的学习体验,同时也欢迎大家推荐更好用的语音合成引擎——您的声音对我们非常重要!
课程
昇腾Torch-NPU API补齐指导课
--
0分钟
10
该课程介绍基于昇腾硬件补齐Torch-NPU API的指导,包括测试用例检索、测试用例代码要求、PR提交、Patch文件生成等内容。
课程
MindSpeed RL强化学习全流程
4.8
16分钟
27
本课程系统介绍基于昇腾MindSpeed RL套件的大模型强化学习后训练全流程技术。内容涵盖从行业趋势洞察、强化学习核心理论(如GRPO算法),到MindSpeed RL套件的训推共卡、0冗余内存调度、流式数据引擎等关键技术详解,并包含完整的实操演练。课程旨在帮助学员深入理解强化学习如何驱动大模型性能跃迁,并掌握使用MindSpeed RL套件进行高效、稳定RLHF/RLTF训练的工程实践能力,从而具备在企业级场景中部署和优化大模型后训练流程的核心技能。 第一章 强化学习趋势洞察 第二章 强化学习基础理论 第三章 昇腾强化学习解决方案 为了更高效、准确地传递课程内容,我们采用了语音合成技术,降低人工录制环节的不确定性。目前AI语音可能还不够完美,我们将努力优化播讲效果,力求给您更好的学习体验,同时也欢迎大家推荐更好用的语音合成引擎——您的声音对我们非常重要!
课程
CATLASS算子开发初体验
--
2小时
5
本课程学习如何通过CATLASS API来开发GEMM算子并进行调试,并介绍CATLASS算子的调用方式,打通算子开发到实际应用的落地链路,同时详细介绍前面使用的相关API
课程
CATLASS模板库探秘--CATLASS模板库基本概念介绍
--
2小时
3
通过讲解CATLASS基础知识及演示实操流程帮助开发者快速入门,全面掌握CATLASS模板库的使用方法