下载
EN
注册
我要评分
文档获取效率
文档正确性
内容完整性
文档易理解
在线提单
论坛求助
昇腾小AI

分析Profiling数据

开发人员可通过分析Profiling工具解析得到Timeline和Summary文件,识别性能瓶颈点。

下面仅介绍常用的关键性能数据文件,关于更多Profiling数据文件的介绍可参见性能调优工具指南

  • timeline文件:step_trace_*.csv
    “step_trace_*.csv”记录了迭代轨迹数据信息,包含每轮迭代的耗时,主要字段及含义如下:
    • Iteration Time:一轮迭代的计算时间,主要包含FP/BP和Grad Refresh两个阶段的时间。
    • FP to BP Time:网络正向传播和反向传播的计算时间。
    • Iteration Refresh:迭代拖尾时间。
    • Data Aug Bound:两个相邻Iteration Time的间隔时间。

    展示数据如下图所示,开发者进行数据分析时,需要注意选择合适的Iteration ID和Model ID的数据。

    图1 step_trace_*.csv文件示例

    从上面示例可以看出,Model ID=1的数据明显与后续不同,为初始化图,而Model ID=11才为真正的迭代计算图,因此要选择Model ID=11的数据进行分析。另外,可以看到在Model ID=11,Iteration ID=1时,Data Aug Bound的时间很长,因为该阶段存在编译等操作,所以耗时较长,因此需要选择Model ID=11且Iteration ID>2的数据进行分析。

  • summary文件:op_statistic_*.csv与op_summary_*.csv

    “op_statistic_*.csv”文件记录了AI Core和AI CPU算子调用次数及耗时统计,“op_summary_*.csv”文件记录了详细的AI Core和AI CPU算子数据。

    开发者可根据“op_statistic_*.csv”文件初步判断耗时较长的算子,然后再根据耗时长的算子,查找“op_summary_*.csv”文件中的详细信息,从而定位出最小粒度事件。

搜索结果
找到“0”个结果

当前产品无相关内容

未找到相关内容,请尝试其他搜索词