导出性能数据
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
√ |
√ |
|
√ |
|
√ |
|
√ |
|
√ |
功能说明
本功能用于导出性能数据。
注意事项
在导出性能数据前,需要先完成解析性能数据。
命令格式
- 导出timeline数据和db文件
python3 msprof.py export timeline -dir <dir> [-reports <reports_sample_config.json>] [--iteration-id <iteration_id>] [--model-id <model-id>] [--iteration-count <iteration_count>] [--clear]
- 导出summary数据和db文件
python3 msprof.py export summary -dir <dir> [--iteration-id <iteration_id>] [--model-id <model-id>] [--iteration-count <iteration_count>] [--format <export_format>] [--clear]
- 导出db文件
python3 msprof.py export db -dir <dir>
参数说明
参数名 |
描述 |
可选/必选 |
|---|---|---|
-dir或--collection-dir |
收集到的性能数据目录。须指定为PROF_XXX目录或PROF_XXX目录的父目录,例如: /home/HwHiAiUser/profiler_data/PROF_XXX。 |
必选 |
-reports |
传入用户自定义的reports_sample_config.json配置文件,会根据配置文件中指定的范围导出相应的性能数据文件。参数实现与msprof --reports一致,详细介绍请参见使用示例(--reports参数)。 |
可选 |
--iteration-id |
迭代ID。需配置为正整数。默认值为1。与--model-id必须同时配置。
|
可选 |
--model-id |
模型ID。需配置为正整数。与--iteration-id必须同时配置,--iteration-id未配置且不配置--model-id时,默认导出所有模型ID对应的数据。
|
可选 |
--iteration-count |
导出连续迭代的个数,取值范围为1~5的整数,根据--iteration-id配置的值为起始Step,导出连续数量的Step,比如配置--iteration-count为3,--iteration-id为1,则导出Step为1、2、3。 |
可选 |
--format |
summary数据文件的导出格式,支持csv和json两种格式,默认值为csv。 仅配置summary参数时支持。 本文中summary文件介绍均以csv文件为例。 |
可选 |
--clear |
数据精简模式,开启后将在导出性能数据后删除PROF_XXX/device_{id}下的sqlite目录,以节省存储空间。配置该参数时表示开启数据精简模式,未配置表示关闭,默认关闭。 |
可选 |
-h或--help |
显示帮助信息,仅在获取使用方式时使用。 |
可选 |
使用示例
- 登录安装了Toolkit包的环境。
- 切换至msprof.py脚本所在目录。
${INSTALL_DIR}/tools/profiler/profiler_tool/analysis/msprof,${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。以root用户安装为例,安装后文件默认存储路径为:/usr/local/Ascend/cann。
- 导出性能数据。可以导出timeline、summary和db三类文件,命令行格式如下:
- 导出timeline数据和db文件
python3 msprof.py export timeline -dir /home/HwHiAiUser/profiler_data/PROF_XXX
- 导出summary数据和db文件
python3 msprof.py export summary -dir /home/HwHiAiUser/profiler_data/PROF_XXX
- 导出db文件,生成汇总所有性能数据的.db格式文件(msprof_时间戳.db)。
python3 msprof.py export db -dir /home/HwHiAiUser/profiler_data/PROF_XXX
- 默认情况下,导出所有性能数据。
- 单算子场景和仅执行采集AI处理器系统数据的场景(即msprof采集命令未配置用户应用程序参数--application的情况),不支持--iteration-id和--model-id参数。
- 导出timeline数据和db文件
输出说明
执行完上述命令后,会在collection-dir目录下的PROF_XXX目录下生成mindstudio_profiler_output目录和msprof_*.db文件。
生成的Profiling数据目录结构如下所示。
- 单采集进程
1 2 3 4 5 6 7 8 9 10 11 12 13 14
└── PROF_XXX ├── device_0 │ └── data ├── device_1 │ └── data ├── host │ └── data ├── msprof_*.db └── mindstudio_profiler_output ├── msprof_{timestamp}.json ├── step_trace_{timestamp}.json ├── xx_*.csv ... └── README.txt
- 多采集进程
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
└── PROF_XXX1 ├── device_0 │ └── data ├── host │ └── data ├── msprof_*.db └── mindstudio_profiler_output ├── msprof_{timestamp}.json ├── step_trace_{timestamp}.json ├── xx_*.csv ... └── README.txt └── PROF_XXX2 ├── device_1 │ └── data ├── host │ └── data ├── msprof_*.db └── mindstudio_profiler_output ├── msprof_{timestamp}.json ├── step_trace_{timestamp}.json ├── xx_*.csv ... └── README.txt
- 多Device场景下,若启动单采集进程,则仅生成一个PROF_XXX目录,若启动多采集进程则生成多个PROF_XXX目录,其中device目录在PROF_XXX目录下生成,每个PROF_XXX目录下生成多少个device目录与用户实际操作有关,不影响性能数据分析。
- 性能数据详细介绍请参见性能数据文件参考。
- mindstudio_profiler_output目录中的文件是根据采集的实际性能数据进行生成,如果实际的性能数据没有相关的数据文件,就不会导出对应的timeline和summary数据。
- 使用export命令能直接从已解析的性能数据中导出数据文件。当性能数据未解析时,单独执行export命令也能进行解析性能数据并导出数据文件。
- 对于被强制中断的msprof采集进程,工具会保存已采集的原始性能数据,也可以使用export解析并导出。