性能调优流程
迁移到昇腾AI处理器进行训练的网络如果存在性能不达标的问题,可按照如下流程进行性能调优:
    图1 TensorFlow网络性能调优流程
 
   
    
   - 当性能不达标时,优先推荐进行如下通用的性能提升操作。- 使能自动混合精度训练模式。
- 替换GELU激活函数。
- 使用AOE工具进行子图、算子以及梯度切分策略的调优。
 详细操作请参见基本调优。 
- 再次执行模型训练,并评估训练性能是否达标。- 若性能达标 —> 调优结束。
- 若性能不达标 —> 执行3。
 
- 使用Profiling工具采集性能数据并分析。参考Profiling数据采集与分析进行性能数据的采集、解析导出与分析。 
- 根据识别的性能瓶颈参见进阶调优进行进一步的性能提升。
- 再次执行模型训练,进行回归测试,评估训练性能是否达标。- 若性能达标 —> 调优结束。
- 若性能不达标 —> 再次执行AOE自动调优。
 
     父主题: 性能调优