准备离线模型dump数据文件
前提条件
在准备dump数据前,请参见《ATC工具使用指南》完成模型转换,准备好模型文件;如果涉及模型量化,请参见本手册中的“昇腾模型压缩工具使用指南”章节完成量化操作后再进行模型转换,生成量化的模型文件。并请配套生成的模型文件完成应用工程的编译、运行,确保工程正常。
dump数据
参考以下步骤进行离线模型dump操作:
- 打开工程文件,查看调用的aclInit()或aclmdlSetDump()函数,获取acl.json文件路径。
- 在查出的目录下修改acl.json文件(如不存在,则需要新建,建议放在工程编译后的out目录下),添加dump配置,格式如下所示。
{ "dump":{ "dump_list":[ { "model_name":"ResNet-101" }, { "model_name":"ResNet-50", "layer":[ "conv1conv1_relu", "res2a_branch2ares2a_branch2a_relu", "res2a_branch1", "pool1" ] } ], "dump_path":"/home/HwHiAiUser/output", "dump_mode":"output", "dump_op_switch":"off" } }
表1 acl.json文件格式说明 配置项
说明
取值
是否必选
备注
dump
--
--
是
- 不具有输出的TBE算子、AI CPU算子,如StreamActive、Send、Recv、const等不会生成dump数据;编译后的模型中部分算子并不会在AI CPU或AI Core执行,如concatD类型算子,则无法生成dump数据。
- 采用dump部分算子场景下,因data算子不会在AI CPU或AI Core上执行,如果用户填写dump data节点算子时需要一并填写data节点算子的后继节点,才能dump出data节点算子数据。
dump_list
待dump数据的整网模型列表
- 如果存在多个模型需要dump,则需要为每个模型创建dump配置,且每个模型之间用英文逗号隔开。
- 如果仅dump单算子模型时,则dump_list为空,dump_op_switch配置为on。
是
-
model_name
模型名称
- 模型加载方式为文件加载时,填入模型文件的名称,不需要带后缀名;也可以配置为ATC模型文件转换后的json文件里的最外层"name"字段对应值。
- 模型加载方式为内存加载时,配置为ATC模型文件转换后的json文件里的最外层"name"字段对应值。
是
- 各个模型的model_name值须唯一
layer
算子名
- 当需要dump指定的部分算子时,按格式配置layer字段,每行配置模型中的一个算子名,且每个算子之间用英文逗号隔开。
- 当需要dump模型的所有算子时,不需要包含layer字段。
否
在IO性能相对较差的开发者板(比如Atlas 200 DK)上,可能会出现由于数据量过大导致执行超时,所以不建议全量dump,请指定算子进行dump。
dump_path
dump数据文件存储到运行环境的目录
支持配置绝对路径或相对路径:
- 绝对路径配置以“/”开头,例如:/home/HwHiAiUser/output。
- 相对路径配置直接以目录名开始,例如:output。
是
该参数指定的目录需要提前创建且确保安装时配置的运行用户具有读写权限。
dump_mode
dump数据模式
- input:dump算子的输入数据。
- output:dump算子的输出数据,默认取值output。
- all:dump算子的输入、输出数据。
否
-
dump_op_switch
单算子模型dump数据开关
- on:开启单算子模型dump。
- off:关闭单算子模型dump,默认取值off
否
-
- 运行应用工程,生成dump数据文件。
工程运行完毕后,可以在运行环境查看到生成的dump数据文件。生成的路径及格式说明:
{dump_path}/{time}/{deviceid}/{model_name}/{model_id}/{data_index}/{dump文件} 单算子模型dump时为{dump_path}/{time}/{deviceid}/{dump文件}
表2 dump数据文件路径说明 路径key
说明
备注
dump_path
acl.json中配置的dump数据文件存储目录
-
time
dump数据文件落盘的时间
格式为:YYYYMMDDHHMMSS
deviceid
Device设备ID号
-
model_name
模型名称
如果model_name出现了“.”、“/”、“\”、空格时,转换为下划线表示。
model_id
模型ID号
-
data_index
针对每个Task ID执行的次数维护一个序号,从0开始计数,该Task每dump一次数据,序号递增1
-
dump文件
命名规则格式为{op_type}.{op_name}.{taskid}.{stream_id}.{timestamp}。如果按命名规则定义的文件名称长度超过了OS文件名称长度限制(一般是255个字符),则会将该dump文件重命名为一串随机数字,映射关系可查看同目录下的mapping.csv。
如果op_type、op_name出现了“.”、“/”、“\”、空格时,转换为下划线表示。