执行AOE调优

  • 单个AOE进程时,请确保调优用户的家目录下磁盘可用空间>=20G,可用内存>=32G。注意:如果模型中存在大shape算子,可能需要更多内存。多个AOE进程时,请自行增加相应的磁盘空间和内存。
  • AOE不支持不同用户同时使用同一device进行调优。
  • 调优前,请确保关闭Profiling功能,避免影响调优结果。关闭Profiling功能具体操作请参见性能分析工具使用指南
  • 推荐先进行子图调优,再进行算子调优。原因是:先进行子图调优会生成图的切分方式,子图调优后算子已经被切分成最终的shape了,再进行算子调优,会基于这个最终shape去做算子调优。如果优先算子调优,这时调优的算子shape不是最终切分后的算子shape,不符合实际使用场景。
AOE调优引擎详细解释请参见AOE参数说明

AOE调优引擎还提供了环境变量控制功能,详情可参见配置环境变量