获取性能数据 在进行性能优化之前,需要拿到准确的性能数据,了解性能现状,并根据性能现状分析下一步的优化方向。Ascend C提供了多种性能测试方法,包括上板Profiling、单算子性能仿真流水图等手段。 上板Profiling 如下命令行是一个算子上板性能数据采集的示例,可以根据自身的需要灵活组合配置参数。示例中--output为可选参数,用于指定收集到的性能数据的存放路径;$HOME/projects/MyApp/out/main为算子可执行文件。 msprof op --output=$HOME/projects/output $HOME/projects/MyApp/out/main 如下示例则展示了部分性能数据文件的样例: 图1 PipeUtilization.csv(计算单元和搬运单元耗时占比)文件示例 详细的字段说明和性能分析工具的具体使用方法请参考上板性能数据采集。 算子仿真流水图 算子调优工具msProf支持仿真环境下的性能数据采集和自动解析。使用msProf工具获取仿真流水图的具体方式请参考指令流水图。 指令流水图支持MindStudio Insight可视化呈现,MindStudio Insight工具以时序图方式为用户提供指令在昇腾AI处理器上的运行情况,用户可通过分析时序图中的指令详情、指令执行时间、指令关联代码的调用栈及指令/流水间同步连线等信息,识别微观指令的时序优化点。 图2 时间线界面 本文中部分样例中展示的算子仿真流水图和通过浏览器查看的呈现方式不一致,但是其中的关键字段含义是对应的,开发者可以参考指令流水图查看具体字段的含义。 父主题: 性能分析