场景介绍
当前用于训练的昇腾AI处理器进行Profiling时,主要通过CANN软件包来进行Profiling数据的获取与解析,具体如下:
软件包 |
Profiling使能说明 |
---|---|
开发套件包 Ascend-cann-toolkit |
提供Graph API Profiling接口,支持在训练过程中采集Job Profiling数据。 |
调测工具包,内部包含Profiling数据采集工具msprof和Profiling解析工具msprof.py,针对Profiling分别作用如下。
|
|
训练软件包 Ascend-cann-nnae |
提供Graph API Profiling接口,支持在训练过程中采集Job Profiling数据。 |
根据表1中组合包不同安装场景,当前主要有以下三种情形:
- 场景一:昇腾训练设备部署开发套件包Ascend-cann-toolkit,对应开发环境,但同时可以作为运行环境进行模型训练。
此场景下既能采集Job Profiling数据,又能采集System Profiling数据,同时采集好的Profiling数据也能在当前环境中进行解析。此场景支持训练业务的全量功能,包括算子开发、模型训练以及性能调优,用户在此场景下可实现Profiling全部操作,当用户需要进行代码开发、编译、运行、调测等开发活动,推荐使用此场景。
- 场景二:昇腾训练设备部署训练软件包Ascend-cann-nnae,对应运行环境。
此场景下仅能采集Job Profiling数据,无法采集System Profiling数据。此场景主要进行模型训练,训练过程中采集的Profiling数据需要拷贝至安装了开发套件包Ascend-cann-toolkit的环境中进行数据解析。如果用户想进行模型性能分析,不推荐此场景。
- 场景三:非昇腾设备上安装开发套件包Ascend-cann-toolkit,对应纯开发环境,不能作为运行环境进行模型训练。

- 支持在容器场景下进行Profiling数据的采集和解析,容器场景下的采集方式取决于在容器中安装的CANN软件包,参见表1。
- 用户在容器场景下指定Profiling数据落盘路径时,容器场景需要指定为宿主机中映射进容器的路径,ModelArts场景需要将OBS的路径挂载到开发环境所在服务器中,方便用户后续提取Profiling数据进行解析。
父主题: 使用前必读