昇腾社区首页
中文
注册
GEMM类算子调优
GEMM类算子调优
1
课程
1
教程
2.5小时
547
暂无评分
我要评分
本课程以通用矩阵乘法(GEMM)为基准,揭示昇腾NPU上算子调优的实操技巧。学员将学习Atlas 800T A2芯片的AIC/AIV分离架构特性,掌握MTE2/MTE3搬运单元的对齐策略。
开始学习
GEMM类算子调优课程
1
GEMM类算子调优操作指导
2
完成路径
额外的成长积分
50积分
知识点
课程重点讲解双缓冲(Double Buffer)技术实现矩阵乘法的流水线并行,通过CGEMM复数运算案例展示虚实分离的高效实现方式。学员将通过mprof工具对实际的SGEMM性能进行比对,掌握算子性能瓶颈识别方法。
发布学习笔记,解答同学疑问,更有丰富奖励等你来参与
查看详情