昇腾社区首页
中文
注册
开发者
下载

DUMP_GRAPH_LEVEL

功能描述

把整个图编译流程中各个阶段的图描述信息打印到文件中。

此环境变量支持如下两种配置方式,两种方式均是控制图落盘的个数,用户可以按需使用,注意两种配置方式不支持混合使用:

  • 配置数值,取值如下:
    • 1:dump所有阶段的图。
    • 2:dump白名单阶段的图。具体白名单图请参见表1中的“是否白名单”列。
    • 3:dump最后的生成图,即经过GE(Graph Engine,图引擎)优化、编译后的图。
    • 4:dump最早的生成图,即经过GE解析映射算子后,给到软件栈的编译入口图,此时图结构尚未经过GE的编译优化。
  • 配置按照“|”分隔的字符串,配置如下:

    例如配置为"aa|bb",则表示dump出名称包含aa和bb的图,aa和bb需要指定为图编译流程中的合法字符串,合法字符串的获取可以从全量的dump图得到。

DUMP_GRAPH_LEVEL环境变量只有在DUMP_GE_GRAPH开启时才生效,默认值为2。

配置示例

  • 配置为数值:
    export DUMP_GRAPH_LEVEL=1
  • 配置为按照|分隔的字符串:
    export DUMP_GRAPH_LEVEL="PreRunBegin|AfterInfershape"

使用约束

  • 如果此环境变量设置了其他非法值,可能会导致未定义的行为发生。
  • 如果开启了采集算子dump数据功能,可以参考图引擎开发指南>ge.exec.enableDump参数,即使不配置DUMP_GRAPH_LEVEL环境变量,或者配置export DUMP_GRAPH_LEVEL="PreRunBegin|AfterInfershape"但不包括“Build”字符串,最终都会dump子图ge_proto_xxxx_Build.txt。
  • 此环境变量需要配合DUMP_GE_GRAPH使用,即开启DUMP_GE_GRAPH的场景下,可通过DUMP_GRAPH_LEVEL控制生成的dump图信息。全量dump图信息请参见表1
    表1 dump图详细信息说明

    序号

    子图名称

    所处阶段描述

    是否白名单

    1

    ge_proto_xxxx_GraphPreRunBegin.txt

    Graph编译前的图

    -

    2

    ge_proto_xxxx_AfterFlowGraphPartition.txt

    Flow切分后的图(flow切分是应用于DataFlow中的切分方式)

    -

    3

    ge_proto_xxxx_AfterParallelPartitioner.txt

    pipeline并行切分后的图(这里的pipeline指后端推理场景的PP)

    -

    4

    ge_proto_xxxx_PreRunBegin.txt

    原始图结构

    白名单

    5

    ge_proto_xxxx_RunCustomPassBeforeInfershape.txt

    在InferShape之前用户自定义Pass的出口图

    白名单

    6

    ge_proto_xxxx_PreRunAfterInitPreparation.txt

    经历了图准备阶段所有初始化处理之后的图结构

    -

    7

    ge_proto_xxxx_PreRunAfterHandleSummaryOp.txt

    对Summary节点做处理之后的图结构

    -

    8

    ge_proto_xxxx_PrepareAfterCheckAndUpdateInput.txt

    校验并更新图输入数据处理之后的图结构

    -

    9

    ge_proto_xxxx_PrepareAfterGraphEquivalentTransformation.txt

    将For循环图结构同等替换成While循环图结构处理之后的图结构

    -

    10

    ge_proto_xxxx_PrepareAfterProcessOutput.txt

    对图数据进行相关处理之后的图结构

    -

    11

    ge_proto_xxxx_PrepareAfterOptimizeAfterGraphNormalization.txt

    图标准化后图优化操作出口图

    -

    12

    ge_proto_xxxx_PrepareAfterInsertAipp.txt

    在配置了AIPP参数下,对图进行AIPP相关处理之后的图结构

    -

    13

    ge_proto_xxxx_PrepareAfterProcessAippNodesDataFormat.txt

    AIPP节点格式刷新出口图

    -

    14

    ge_proto_xxxx_PreRunAfterNormalizeGraph.txt

    图标准化出口图

    白名单

    15

    ge_proto_xxxx_PreRunAfterOptimizeGraphInit.txt

    图优化初始化出口图

    -

    16

    ge_proto_xxxx_OptimizeGraph_TagNoConstFoldingAfter.txt

    量化场景使用,FE会给算子打上不做常量折叠标签,GE在执行常量折叠时会判断此标签,如果存在,则不执行常量折叠

    -

    17

    ge_proto_xxxx_HcclAfterOptimizeGraphPrepare.txt

    HCCL图准备阶段优化后的图

    -

    18

    ge_proto_xxxx_PreRunAfterOptimizeGraphPrepare.txt

    经过各算子信息库原图准备处理(OptimizeGraphPrepare接口调用)之后的图结构

    -

    19

    ge_proto_xxxx_PrepareAfterProcessBeforeInfershape.txt

    对条件算子进行死边消除处理之后的图结构

    -

    20

    ge_proto_xxxx_AfterFirstInferformat.txt

    经过全图inferformat处理之后的图结构

    -

    21

    ge_proto_xxxx_AfterInfershape.txt

    经过全图infershape处理之后的图结构,会伴随常量折叠

    白名单

    22

    ge_proto_xxxx_PrepareAfterInferFormatAndShape.txt

    经历完所有InferFormat与InferShape处理之后的图结构,与上图间经历了第二次全图InferFormat

    -

    23

    ge_proto_xxxx_RunCustomPass_AfterInferShape.txt

    在InferShape之后用户自定义Pass的出口图

    白名单

    24

    ge_proto_xxxx_AfterSecondInferformat.txt

    第二次格式推导之后的图

    -

    25

    ge_proto_xxxx_PrepareAfterCtrlFlowPreProcess.txt

    对条件算子做预处理之后的图结构

    -

    26

    ge_proto_xxxx_PrepareAfterGetDynamicOutputShape.txt

    动态档位下,对图输出做处理之后的图结构

    -

    27

    ge_proto_xxxx_PrepareAfterProcessAippStage2.txt

    在AIPP模式下,对图输入节点做相关处理之后的图结构

    -

    28

    ge_proto_xxxx_PrepareAfterPrepareOptimize.txt

    在图准备阶段,做相关优化处理之后的图结构

    -

    29

    ge_proto_xxxx_PreRunAfterPrepare.txt

    目前和上张图相同,经历过所有图准备处理之后的图结构

    白名单

    30

    ge_proto_xxxx_OptimizeQuantGraph_FeGraphFusionAfter.txt

    图优化阶段的量化流程结束后的图结构

    -

    31

    ge_proto_xxxx_OptimizeOriginalGraph_FeGraphFusionAfter.txt

    图融合流程结束后的图结构

    -

    32

    ge_proto_xxxx_OptimizeOriginalGraph_FeTopoSortingAfter.txt

    图融合后进行拓扑排序,排查融合后是否成环的图结构

    -

    33

    ge_proto_xxxx_OptimizeOriginalGraph_DSAFeOpJudgeAfter.txt

    经过动态shape分析后的格式DataType和Format选择的图

    -

    34

    ge_proto_xxxx_HcclBeforeOptimizeOriginalGraph.txt

    HCCL原图优化之前的图

    -

    35

    ge_proto_xxxx_HcclAfterOptimizeOriginalGraph.txt

    HCCL原图优化之后的图

    -

    36

    ge_proto_xxxx_RunCustomPassAfterBuiltinFusionPass.txt

    内部Pass之后用户自定义Pass的出口图

    白名单

    37

    ge_proto_xxxx_PreRunAfterOptimizeOriginalGraph.txt

    经过各算子信息库原图优化处理(OptimizeOriginalGraph接口调用)之后的图结构

    白名单

    38

    ge_proto_xxxx_PrepareAfterUpdateInputOutputByUserOptions.txt

    根据用户参数,对图输入输出做相关处理之后的图结构

    -

    39

    ge_proto_xxxx_PrepareAfterUpdateVariableFormats.txt

    对变量的Format进行相关处理之后的图结构

    -

    40

    ge_proto_xxxx_PreRunAfterPrepareRunningFormatRefiner.txt

    与上图相同

    -

    41

    ge_proto_xxxx_BeforeOptimizeOriginalGraphJudgeInsert.txt

    op_judge流程的入口图

    -

    42

    ge_proto_xxxx_OptimizeOriginalGraph_FeOpDtypeJudgeAfter.txt

    精度模式选择后的图

    -

    43

    ge_proto_xxxx_PreRunAfterRefineRunningPrecision.txt

    精度选择之后的图

    -

    44

    ge_proto_xxxx_OptimizeOriginalGraph_FeOpFormatJudgeAfter.txt

    格式选择后完整op_judge的图

    -

    45

    ge_proto_xxxx_OptimizeOriginalGraph_FeDistHeavyFormatAfter.txt

    重型算子扩散后的图结构

    -

    46

    ge_proto_xxxx_OptimizeOriginalGraph_FeInsertTransNodeAfter.txt

    插入转换算子后的图结构

    -

    47

    ge_proto_xxxx_PreRunAfterRefineRunningFormat.txt

    经过各算子信息库优化处理(OptimizeOriginalGraphJudgeInsert接口调用)之后的图结构

    -

    48

    ge_proto_xxxx_PreRunAfterSubexpressionMigration.txt

    动态分档场景下公共子表达式提取之后的图结构

    -

    49

    ge_proto_xxxx_before_SameTransdataBreadthFusionPass.txt

    SameTransdataBreadthFusionPass入口图

    -

    50

    ge_proto_xxxx_after_SameTransdataBreadthFusionPass.txt

    SameTransdataBreadthFusionPass出口图

    -

    51

    ge_proto_xxxx_OptimizeStage1_1.txt

    图优化1_1阶段处理之后的图结构

    -

    52

    ge_proto_xxxx_OptimizeStage1_2.txt

    图优化1_2阶段处理之后的图结构

    -

    53

    ge_proto_xxxx_PreRunAfterOptimize1.txt

    所有图优化1阶段处理之后的图结构

    -

    54

    ge_proto_xxxx_PreRunAfterOptimizeAfterStage1.txt

    经过各算子信息库优化处理(OptimizeAfterStage1接口调用)之后的图结构

    白名单

    55

    ge_proto_xxxx_RunCustomPassAfterOriginGraphOptimize.txt

    在原图优化阶段后执行自定义pass

    白名单

    56

    ge_proto_xxxx_PreRunAfterInferShape2.txt

    第二次InferShape处理之后的图结构

    -

    57

    ge_proto_xxxx_BeforeStagePartition.txt

    Stage切分前的图

    -

    58

    ge_proto_xxxx_AfterStagePartition.txt

    Stage切分后的图

    -

    59

    ge_proto_xxxx_AfterEnginePlacer.txt

    引擎选择完成后的图

    -

    60

    ge_proto_xxxx_Before_DSP.txt

    动静模型拆分前的图

    -

    61

    ge_proto_xxxx_After_DSP.txt

    动静模型拆分后的图

    -

    62

    ge_proto_xxxx_AfterDynamicShapePartition.txt

    动态shape图拆分之后的图结构

    -

    63

    ge_proto_xxxx_MergedComputeGraphAfterCompositeEnginePartition.txt

    经历对立子图拆分与子图优化处理之后的合并图结构

    -

    64

    ge_proto_xxxx_partition0_rank0_inputNodeGraph_AtomicEnginePartitioning.txt

    原子引擎规则图拆分后,输入节点子图的图结构

    -

    65

    ge_proto_xxxx_partition0_rank1_new_sub_graph1_AtomicEnginePartitioning.txt

    原子引擎规则图拆分后,子图1的图结构

    -

    66

    ge_proto_xxxx_partition0_rank2_new_sub_graph110_AtomicEnginePartitioning.txt

    原子引擎规则图拆分后,子图110的图结构

    -

    67

    ge_proto_xxxx_OptimizeSubgraphPreProc.txt

    子图优化预处理出口图

    -

    68

    ge_proto_xxxx_DNN_VM_RTS_OptimizeSubGraphBefore.txt

    -

    -

    69

    ge_proto_xxxx_DNN_VM_RTS_OptimizeSubGraphAfter.txt

    -

    -

    70

    ge_proto_xxxx_AIcoreEngine_OptimizeSubGraphBefore.txt

    AI Core子图优化入口图

    -

    71

    ge_proto_xxxx_OptimizeSubGraphBefore.txt

    子图优化操作前的子图结构,每张子图都有一份,同名不同序号,总个数根据子图个数确定

    -

    72

    ge_proto_xxxx_OptimizeSubGraphAfter.txt

    子图优化操作后的子图结构,每张子图都有一份,同名不同序号,总个数根据子图个数确定

    -

    73

    ge_proto_xxxx_partition0_rank1_new_sub_graph1_lxfusion_input.txt

    ATC场景和AOE baseline场景的sgat输入图

    -

    74

    ge_proto_xxxx_partition0_rank1_new_sub_graph1_after_rebuild.txt

    AOE sgat内部流程UB融合图

    -

    75

    ge_proto_xxxx_AIcoreEngine_OptimizeSubGraphAfter.txt

    AI Core子图优化出口图

    -

    76

    ge_proto_xxxx_OptimizeSubgraphPostProc.txt

    子图优化后处理出口图

    -

    77

    ge_proto_xxxx_mergedComputeGraph.txt

    图合并之后的图结构,与上图相同

    -

    78

    ge_proto_xxxx_MergedComputeGraphAfterAtomicEnginePartition.txt

    经历对立原子引擎拆分与子图优化处理之后的合并图结构

    -

    79

    ge_proto_xxxx_PreRunAfterOptimizeSubgraph.txt

    子图优化处理之后的图结构

    白名单

    80

    ge_proto_xxxx_OptimizeWholeGraphaicpu_tf_optimizer.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    81

    ge_proto_xxxx_OptimizeWholeGraphaicpu_ascend_optimizer.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    82

    ge_proto_xxxx_OptimizeWholeGraphdvpp_graph_optimizer.txt

    整图优化DVPP优化后出口图

    -

    83

    ge_proto_xxxx_OptimizeWholeGraphhccl_alltoallvc_fusion_optimizer.txt

    HCCL原图优化阶段融合优化后的图

    -

    84

    ge_proto_xxxx_OptimizeWholeGraphAIcoreEngine.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    85

    ge_proto_xxxx_OptimizeWholeGraphDSAEngine.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    86

    ge_proto_xxxx_OptimizeWholeGraphhccl_graph_optimizer.txt

    HCCL原图优化阶段优化的图

    -

    87

    ge_proto_xxxx_OptimizeWholeGraphDNN_VM_RTS_GRAPH_OPTIMIZER_STORE.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    88

    ge_proto_xxxx_OptimizeWholeGraphDNN_VM_RTS_FFTS_PLUS_GRAPH_OPTIMIZER_STORE.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    89

    ge_proto_xxxx_OptimizeWholeGraphDNN_VM_HOST_CPU_OPTIMIZER.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    90

    ge_proto_xxxx_OptimizeWholeGraphge_local_graph_optimizer.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    91

    ge_proto_xxxx_OptimizeWholeGraphffts_plus.txt

    调用各引擎的原图优化接口后的图信息,OptimizeWholeGraph后为引擎名称

    -

    92

    ge_proto_xxxx_PreRunAfterOptimizeWholeGraph.txt

    经过各算子信息库优化处理(OptimizeWholeGraph接口调用)之后的图结构

    -

    93

    ge_proto_xxxx_PreRunAfterOptimize2.txt

    所有图优化2阶段处理之后的图结构

    -

    94

    ge_proto_xxxx_PreRunAfterOptimizeGraphBeforeBuild.txt

    模型编译入口图

    白名单

    95

    ge_proto_xxxx_PreRunAfterOptimizeTensorMove.txt

    优化冗余TensorMove节点之后的图

    -

    96

    ge_proto_xxxx_BeforeHandleMemConflict.txt

    处理内存冲突之前的图

    -

    97

    ge_proto_xxxx_AfterHandleMemConflict.txt

    处理内存冲突之后的图

    -

    98

    ge_proto_xxxx_BeforeHandleMemoryLayoutConflict.txt

    解决内存排布冲突入口图

    -

    99

    ge_proto_xxxx_PreRunAfterMemConflictProc.txt

    解决内存读写冲突出口图

    -

    100

    ge_proto_xxxx_partition0_rank0_inputNodeGraph_SecondPartitioning.txt

    二拆操作后,输入节点子图的图结构

    -

    101

    ge_proto_xxxx_partition0_rank1_new_sub_graph1_SecondPartitioning.txt

    二拆操作后,子图1的图结构

    -

    102

    ge_proto_xxxx_partition0_rank2_new_sub_graph110_SecondPartitioning.txt

    二拆操作后,子图110的图结构

    -

    103

    ge_proto_xxxx_BeforeUnfoldSubgraphs.txt

    动态shape图展开之前的图

    -

    104

    ge_proto_xxxx_AfterUnfoldSubgraphs.txt

    动态shape图展开之后的图

    -

    105

    ge_proto_xxxx_RunCustomPass_BeforeAssignLogicStream{pass_name}.txt

    用户自定义流分配Pass处理之前的图

    白名单

    106

    ge_proto_xxxx_RunCustomPass_AfterAssignLogicStream{pass_name}.txt

    用户自定义流分配Pass处理之后的图

    白名单

    107

    ge_proto_xxxx_AfterAssignResource.txt

    流分配、内存分配、GenTask之后的图

    -

    108

    ge_proto_xxxx_Build.txt

    模型编译出口图

    白名单

    109

    ge_proto_xxxx_PreRunAfterBuild.txt

    与上图相同

    -

    110

    ge_proto_xxxx_BeforeAttrsCompress.txt

    离线模型压缩前的图

    -

    111

    ge_proto_xxxx_AfterAttrsCompress.txt

    离线模型压缩后的图

    -

    112

    ge_proto_xxxx_BeforeAttrsDecompress.txt

    离线模型解压前的图

    -

    113

    ge_proto_xxxx_AfterAttrsDecompress.txt

    离线模型解压后的图

    -

    114

    ge_proto_xxxx_ComputeGraphBeforeLowering.txt

    lowering前的计算图

    白名单

    115

    ge_proto_xxxx_Before_MultiStream_LoweringFirstLastEventSync.txt

    多流插入Event之前的执行图

    -

    116

    ge_proto_xxxx_ExeGraphBeforeOptimize.txt

    执行图优化前的执行图

    白名单

    117

    ge_proto_xxxx_AfterZeroCopy.txt

    零拷贝优化之后的执行图

    -

    118

    ge_proto_xxxx_AfterCEM.txt

    CEM优化之后的执行图

    -

    119

    ge_proto_xxxx_AfterCopyFlowLaunch.txt

    随路拷贝优化后的执行图

    -

    120

    ge_proto_xxxx_TrustOutTensorAfter.txt

    TrustOutTensor优化之后的执行图

    -

    121

    ge_proto_xxxx_AfterAicpuFuseHostInputs.txt

    AicpuFuseHostInputs优化之后的图

    -

    122

    ge_proto_xxxx_ExecuteGraphAfterSplit.txt

    动态shape最终的执行图

    白名单

支持的型号

Atlas 训练系列产品

Atlas 推理系列产品

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

Atlas 350 加速卡

Atlas 200I/500 A2 推理产品