GE DUMP介绍
执行图的分析,要基于GE优化过后的图,需要通过配置相关环境变量dump下来。
涉及的环境变量有DUMP_GE_GRAPH、DUMP_GRAPH_LEVEL、DUMP_GRAPH_PATH,详细请参考《CANN 环境变量参考》中的“图编译”。
常用配置为DUMP_GE_GRAPH=2、DUMP_GRAPH_LEVEL=2。
在dump图文件夹下,会生成若干张pbtxt/pb,其均为在图优化过程中各个阶段执行完后,按顺序生成。例如ge_onnx_00000101_graph_0_Build.pbtxt中00000101为这个序号,后面的graph_0的0代表rank id,在推荐推理场景恒为0。这里的build图对应的就是执行阶段的图,在需要通过profiling与该图对应的网络结构,分析优化空间。
msIT工具:dump出GE图,再用工具的msit graph功能,扫描重复结构,重复出现次数多,且占比较大的子结构,可以考虑手写融合pass和融合算子进行优化,其中也有子图抽取功能,比如图太大打不开的场景,可以抽取某块子图打开来分析,推荐使用第三方网络可视化工具:netron.app。
父主题: 性能调优工具介绍