进行CANN profiling数据采集，需要在训练脚本（如train_*.py文件）内添加如下profiling参数配置，之后执行训练：

cann_profiling_path = './cann_profiling'
if not os.path.exists(cann_profiling_path):
    os.makedirs(cann_profiling_path) 
with torch.npu.profile(cann_profiling_path):   
    out = model(input_tensor)
    loss = loss_func(out,target)
    loss.backward()
    optimizer.zero_grad()
    optimizer.step() 
exit()

完成profiling数据采集后，请参见《性能分析工具使用指南》“高级工具>数据解析与导出”章节将原始数据文件解析并导出为可视化的Timeline和Summary文件，再参见《性能分析工具使用指南》“Profiling数据说明”章节解读采集的性能数据。

采集CANN profiling数据