进行CANN profiling数据采集,需要在训练脚本(如train_*.py文件)内添加如下profiling参数配置,之后执行训练:
cann_profiling_path = './cann_profiling' if not os.path.exists(cann_profiling_path): os.makedirs(cann_profiling_path) with torch.npu.profile(cann_profiling_path): out = model(input_tensor) loss = loss_func(out,target) loss.backward() optimizer.zero_grad() optimizer.step() exit()
完成profiling数据采集后,请参见《性能分析工具使用指南》“高级工具>数据解析与导出”章节将原始数据文件解析并导出为可视化的Timeline和Summary文件,再参见《性能分析工具使用指南》“Profiling数据说明”章节解读采集的性能数据。