界面介绍
功能说明
在算子性能调优过程中,MindStudio Insight工具以时间线(Timeline)的呈现方式,将算子运行过程中,底层指令的详细执行情况平铺在时间轴上,直观呈现AI处理器每个Core上的每个Pipe中指令的调用顺序和耗时情况。通过分析时间线,用户可以通过查看指令详情、指令耗时等信息快速定位出性能瓶颈。
界面展示
时间线(Timeline)界面包含工具栏(区域一)、图形化展示(区域二)和数据窗格(区域三)三个部分组成,如图1所示。
- 区域一:工具栏,包含常用快捷按钮,从左至右依次为标记列表、过滤(支持按卡或按泳道过滤展示)、搜索、连线事件、重置缩放(页面复原)和时间轴缩小放大按钮。
- 区域二:图形化展示,左侧显示各Core的分层信息,一层级为Core,二层级为Pipe。右侧为时间线视图,逐行对时间线进行图形化展现,包括各指令执行序列和执行时长。具体泳道信息请参见表1。
- 区域三:数据窗格,统计信息或指令详情信息展示区,选中详情(Slice Detail)为选中单个指令的详细信息、选中列表(Slice List)为某一泳道选中区域的指令列表信息。
表1 泳道信息 泳道名称
说明
ALL
表示在这个通道的指令在所有通道都执行。
SCALAR
标量运算单元。
FLOWCTRL
控制流指令。
MTE1
数据搬运流水,数据搬运方向为:L1 ->{L0A/L0B, UBUF}。
CUBE
矩阵乘运算单元。
FIXP
数据搬运流水,数据搬运方向为:FIXPIPE L0C -> OUT/L1。
仅
Atlas A2 训练系列产品 /Atlas 800I A2 推理产品 /A200I A2 Box 异构组件导出的性能数据支持展示。MTE2
数据搬运流水,数据搬运方向为:{DDR/GM, L2} ->{L1, L0A/B, UBUF}。
VECTOR
向量运算单元。
MTE3
数据搬运流水,数据搬运方向为:UBUF -> {DDR/GM, L2, L1}、L1->{DDR/L2}。
CACHEMISS
未命中ICACHE。
USEMASK
自定义打点范围。
MTE Throughput
内存吞吐率信息。
- GM_TO_L1:GM往L1搬运的数据吞吐率。
- GM_TO_TOTAL:GM输出总数据吞吐率。
- GM_TO_UB:GM往UB搬运的数据吞吐率。
- L1_TO_GM:L1往GM搬运的数据吞吐率。
- TOTAL_TO_GM:GM输入总数据吞吐率。
- UB_TO_GM:UB往GM搬运的数据吞吐率。

通过观察时间线视图各个层级上的耗时长短、间隙等判断对应指令和Pipe是否存在性能问题,如指令执行是否存在瓶颈、是否存在高耗时的指令等。
父主题: 时间线(Timeline)