性能分析概要
专家系统分析完成,在输出结果开头会输出整体性能分析报告,展示整体性能概要。如图1所示。
输出字段含义请参见表1所示。
| 
         字段  | 
       
         说明  | 
      
|---|---|
| 
         Summary Reoprt  | 
       
         模型性能分析概要。  | 
      
| 
         Report of model performance  | 
       
         模型性能分析报告。  | 
      
| 
         Summary information of model performance  | 
       
         模型性能分析总览。  | 
      
| 
         Execute Time  | 
       
         执行时间。  | 
      
| 
         Aicore Time(us)  | 
       
         AI Core执行时间,单位为us。  | 
      
| 
         Task Duration(us)  | 
       
         任务执行时间,单位为us。  | 
      
| 
         Avg BlockDim Usage  | 
       
         平均BlockDim利用率,算子执行时的平均核心数,反映芯片利用情况。  | 
      
| 
         Calculate throughput  | 
       
         计算吞吐量。  | 
      
| 
         Cube Throughput(GOps)  | 
       
         Cube吞吐量,单位为GOps。  | 
      
| 
         Vector Throughput(GOps)  | 
       
         Vector吞吐量,单位为GOps。  | 
      
| 
         Memory Redundant  | 
       
         内存冗余量。  | 
      
| 
         Real Memory Input(GB)  | 
       
         真实内存读入量,单位为GB。  | 
      
| 
         Real Memory Output(GB)  | 
       
         真实内存写出量,单位为GB。  | 
      
| 
         Theory Memory Input(GB)  | 
       
         理论内存读入量,单位为GB。  | 
      
| 
         Theory Memory Output(GB)  | 
       
         理论内存写出量,单位为GB。  | 
      
| 
         Memory Read Redundant  | 
       
         内存读入冗余系数。真实内存读入量/理论内存读入量。  | 
      
| 
         Memory Write Redundant  | 
       
         内存写出冗余系数。真实内存写出量/理论内存写出量。  | 
      
| 
         Pipeline Bound  | 
       
         流水利用率。  | 
      
| 
         Cube Ratio  | 
       
         Cube利用率。  | 
      
| 
         Vector Ratio  | 
       
         Vector利用率。  | 
      
| 
         Scalar Ratio  | 
       
         Scalar利用率。  | 
      
| 
         MTE1 Bound  | 
       
         MTE1瓶颈。  | 
      
| 
         MTE2 Bound  | 
       
         MTE2瓶颈。  | 
      
| 
         MTE3 Bound  | 
       
         MTE3瓶颈。  | 
      
| 
         Tiling Strategy  | 
       
         内存读入量的数据切片策略。数值达到0.8为优,Performance值为Good;小于0.8则为差,Performance值为Bad。根据Memory Redundant的数值计算得出。  | 
      

