功能说明
专家系统根据输入数据的不同执行的分析功能不同,分析功能与输入数据文件的对应关系如下:
- 算子优化分析:算子仿真文件
- 基于Timeline的AI CPU算子优化:Profiling Task Scheduler任务调度文件
参见《CANN 开发工具指南》中的“Profiling工具使用指南”章节,完成Profiling采集以及Summary和Timeline导出,支持一组或多组Profiling数据。
- 算子融合推荐:
- 基于Roofline模型的算子瓶颈识别与优化建议:
- cce代码:可通过ATC工具添加--op_debug_level=4得到,或用户自行在算子编译时保存。参见《ATC工具使用指南》。
- Profiling Task Scheduler任务调度文件:参见《CANN 开发工具指南》中的“Profiling工具使用指南”章节,完成Profiling采集以及Summary和Timeline导出,需要采集4次Profiling数据,分别设置AI Core指标ArithmeticUtilization、PipeUtilization、Memory, MemoryL0、ResourceConflictRatio和MemoryUB。
- om模型离线文件:可通过多种方式生成,例如ATC工具转换,参见《ATC工具使用指南》。
父主题: 操作指南