华为计算微信公众号
昇腾AI开发者公众号
华为计算微博
华为计算今日头条
昇腾社区首页
开发者
主页
开发
文档
活动
学习
论坛
博客
开发者计划
更多
0
/100
资源
支持
积分兑换
NEW
开发者认证
算子开发者认证-工作级(Ascend C方向)
算子开发者认证-工作级(Ascend C方向)
本认证涵盖:客观题综合考察考生对昇腾硬件架构、算子设计与实现方法、算子开发和调试调优工具链的掌握。机试题考察考生使用Ascend C及其他工具开发算子的实操能力
具有算子开发经验的、计划从事算子开发工作的个人开发者
推荐课程
课程1:昇腾AI处理器及CANN软件栈基础
本课程主要介绍昇腾AI处理器及其配套CANN软件的基础知识,以及CANN提供的关键特性。
课程2:昇腾异构编程基础(速成班)
本课程深入解析昇腾AI处理器的达芬奇架构,涵盖AI Core(矩阵/向量计算)、AI CPU(非矩阵任务)、层次化存储系统等核心组件。
课程3:Ascend C算子编程和C++基础
本课程是面向昇腾Triton算子开发的初级课程,通过课程讲解和典型样例,帮助开发者学习如何使用Triton开发算子。
课程4:Ascend C算子开发(进阶)
本课程是Ascend C算子开发的进阶教程,通过课程讲解及样例实操,帮助你学习如何使用Ascend C进行自定义算开发,并在实际应用中调用自定义算子。
课程5:Ascend C算子开发(高级)
本课程是Ascend C算子开发的高级课程,通过课程讲解和样例实操,帮助你学习如何使用Ascend C进行Ascend C复杂算子的开发及验证,以及如何进行性能分析和优化。
课程6:算子注册与模型迁移
本课程系统讲解PyTorch模型迁移到昇腾NPU的实践,涵盖CANN工具链迁移分析、自动化接口替换、自定义算子库注册、精度调试(舍入模式、动态shape)及混合精度适配。
课程7:Ascend C算子编程-矩阵乘
介绍矩阵乘算子如何进行开发
课程8:Ascend C算子编程-融合算子
介绍vector和Cube融合的算子如何进行开发
课程9:Ascend C算子编程常见调试调优方法
介绍算子开发中常见功能、精度问题和性能优化方法
课程10:MindStudio算子开发调试调优工具分享
介绍算子开发中用于功能定位和性能调试的MindStudio开发工具
课程11:面向昇腾Triton算子开发(初级)
本课程是面向昇腾Triton算子开发的初级课程,通过课程讲解和典型样例,帮助开发者学习如何使用Triton开发算子。
课程12:面向昇腾Triton算子开发(进阶)
本课程以Gather算子为典型案例,深度融合Triton算子开发范式与昇腾硬件架构,系统分析代码实现中的关键差异点。内容涵盖算子开发全流程、迁移实践、调试方法、用例解析及自动调优(autotune)特性。
课程13:详解面向昇腾的Triton算子调试和性能优化
介绍Triton-Ascend的算子调试方法与性能检测工具,详解高性能Matmul算子设计逻辑与具体实现流程
案例文档
异构并行编程模型
介绍Host-Device异构协同机制、SPMD编程范式
Tiling实现流程
介绍算子tiling实现流程和编程模板
Matmul矩阵编程
介绍矩阵编程的数据流、数据格式处理,以及数据分块策略
PyTorch框架集成部署自定义算子
介绍算子集成到pytorch框架的方式、torch.library与Pybind注册自定义算子
Ascend C算子调试调优
介绍CPU孪生调试、NPU上板调试2种功能调试手段
MindStudio算子开发工具(MindStudio OpDev Tools)
介绍算子开发工具包,包含msPorf、msDebug等
Ascend C算子性能优化
介绍常见的优化策略(Tiling策略、流水编排、内存访问等)
融合算子编程 - CV融合
介绍CV融合算子的基础概念、使用场景和优势,以及编程范式
融合算子编程 - 通算融合
介绍通算融合类算子的实现,包含数据流分析、算子工程创建、Tiling和kernel设计
我们使用cookie来确保您的高速浏览体验。继续浏览本站,即表示您同意我们使用cookie。
查看详情