迁移总体思路
通用模型迁移适配方法,可以分为四个阶段:迁移分析、模型迁移、精度调试与性能调优,总体流程如下图所示。
 
本手册的内容章节是根据迁移阶段与其对应任务设计的,如表1所示。
| 迁移阶段 | 迁移任务 | 任务描述 | 
|---|---|---|
| 模型选取与约束说明 | 
 | |
| 迁移支持度分析 | 
 | |
| 模型脚本迁移 | 通过模型脚本迁移,实现GPU -> NPU的接口替换、NPU分布式框架改造。 | |
| 环境变量和脚本配置 | 
 | |
| 关键特性适配 | 
 | |
| 模型调试 | 
 | |
| 模型保存与导出 | 参考模型保存与导出用于在线或离线推理。 
 | |
| 精度分析与调优 | 
 | |
| 性能数据采集与评测 | ||
| 模型性能优化实施 | 依据性能瓶颈模块的类型,从性能调优方法寻求优化方法,具体方法包括数据加载优化、NPU亲和适配优化、内存优化、通信优化和调度优化。 此外,本章节还提供了通信优化的建议和可以使能的通信算法,以及调度优化方法。 |