专家系统工具支持如下瓶颈识别功能,每个子功能要求的输入数据不同,功能与输入数据文件的对应关系如下:
- 基于Roofline模型的算子瓶颈识别与优化建议:
- cce代码:可通过ATC工具添加--op_debug_level=4得到,或用户自行在算子编译时保存。参见《ATC工具使用指南》。
- Profiling Task Scheduler任务调度信息数据文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- OM离线模型文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- 基于Timeline的AI CPU算子优化:
- OM离线模型文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Task Schedule任务调度信息数据文件:启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- 算子融合推荐:
- OM离线模型文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Summary文件:使用op_Summary.csv文件和l2_cache.csv文件,启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
- TransData算子识别:
- OM离线模型文件:可通过多种方式生成,例如ATC工具转换,参见模型转换。
- Profiling Summary文件、Profiling基本信息文件(主要获取文件中当前芯片版本的基本信息):参见启动专家系统功能后自动拉起Profiling获取数据,无需手动配置。
输入数据文件名及保存路径请参见输入数据说明。