工具部署
工具简介
一键式精度分析工具,提供了对训练网络进行精度分析的常用功能,主要包括:
该工具封装了TF Adapter的运行参数,帮助用户更方便的使能相关业务特性,同时对CANN Toolkit包中的精度分析工具进行了封装和功能扩展,从而帮助开发人员快速分析精度问题。
使用约束
- 当前该工具仅支持TensorFlow 1.15和TensorFlow 2.6训练场景,TensorFlow 1.15下的精度调优请参考《TensorFlow 1.15网络模型迁移和训练指南》。
- 不能同时采集溢出数据和精度数据。
- 采集溢出数据或精度数据时,都可能会产生较多结果文件,导致磁盘空间不足,请适当控制迭代次数。
工具部署
从https://gitee.com/ascend/tools下载precision_tool文件夹,上传到训练工作目录下,无需安装。目录结构示例:
├── resnet // 训练工作目录 │ ├── __init__.py │ ├── imagenet_main.py // 基于Imagenet数据集训练网络模型 │ ├── imagenet_preprocessing.py // Imagenet数据集数据预处理模块 │ ├── resnet_model.py // resnet模型文件 │ ├── resnet_run_loop.py // 数据输入处理与运行循环(训练、验证、测试) │ ├── cifar10_main // 训练执行入口文件 │ ├── ... │ ├── precision_tool // 一键式精度分析工具目录 │ │ ├── cli.py │ │ ├── ...
- 如果CANN开发/运行环境合一部署,只需将precision_tool文件夹,上传到训练工作目录下即可。
- 如果CANN开发/运行环境独立部署,需要将precision_tool文件夹上传到CANN运行环境的训练工作目录下,同时将precision_tool上传到CANN开发环境的任意目录下。
CANN运行环境(包含昇腾AI处理器,即启动NPU训练的环境),在训练精度调优工作中,主要用于训练时精度数据采集;
CANN开发环境(即安装CANN Toolkit软件的环境),在训练精度调优工作中,主要用于精度数据分析。
典型使用流程
图1 CANN开发/运行环境合一部署


图2 CANN开发/运行环境独立部署


父主题: 精度调优