昇腾社区首页
中文
注册
开发者
下载

界面介绍

功能说明

强化学习(RL)界面提供了强化学习过程中各阶段流水图的可视化展示,使能开发者能够全面了解运行情况,轻松定位问题,并进行深入分析与优化。

界面展示

  • 仅当导入使用mstx打点采集到的控制流数据时,才会展示任务执行时间线。mstx打点采集方式请参见性能调优工具指南Ascend PyTorch Profiler章节的“采集并解析msprof_tx数据”内容。
  • 当导入Verl和MindSpeed框架的性能数据时,需分别导入各自的性能数据文件夹,不支持将两种数据合并放在同一文件夹中导入。

强化学习界面由参数配置栏(区域一)和任务执行时间线(区域二)组成,如图1所示。

图1 强化学习界面
  • 区域一:参数配置栏,自动识别并显示导入数据的“框架”“算法”;当导入的数据大于16卡时,强化学习界面数据可能展示不全,可单击“刷新”解析所有数据,刷新任务执行时间线。
  • 区域二:任务执行时间线,展示的是各卡上每个任务的执行时间,横坐标为时间轴,纵坐标为各设备对应的RankID,不同的颜色代表不同的任务,其中蓝色色块中提供Forward和Backward micro batch标记展示,帮助定位训练阶段的细粒度性能问题。

    通过任务执行时间线图形右侧和下方的滑动框可以缩放、移动时间线,也可以通过Ctrl + 鼠标滚轮进行缩放。