算子溢出检测命令行格式如下:
python3 msaccucmp.py overflow -d dump_path -out output_path [-n topn]
命令行参数说明如表1所示。
参数名 |
参数说明 |
是否必选 |
---|---|---|
-d --dump_path |
Debug file和溢出算子的dump文件所在目录。 请参见《TensorFlow 1.15网络模型迁移和训练指南》中的“手工迁移和训练>更多特性>溢出数据采集”章节获取文件目录。 目录下如果缺少dump文件,则会导致-out输出时缺少npy文件;如果目录下没有Debug file,则表示无溢出。 |
是 |
-out --output_path |
算子溢出分析结果文件输出目录。 输出文件包括:
缺少npy文件,会导致结果文件解析不到溢出算子的输入输出信息。 |
是 |
-n --topn |
解析溢出的前N个算子,取值范围为1~5,默认值为1。 |
否 |
使用以下步骤进行算子溢出分析之前请参见《TensorFlow 1.15网络模型迁移和训练指南》中的“手工迁移和训练>更多特性>溢出数据采集”章节,对dump文件进行算子溢出检测,并生成Debug file和溢出算子的dump文件。
算子溢出检测命令行方式操作步骤:
-out指定的结果文件存放路径,请确保HwHiAiUser用户具有读写权限。
python3 msaccucmp.py overflow -d /MyApp20/dump -out /MyApp20/out -n 3
执行算子溢出检测结果overflow_summary_*.txt文件内容如图1所示。
结果文件信息中,根据展示数据从上到下顺序,展示信息如下: