功能调试

配置项

说明

使用场景

enable_exception_dump

是否dump异常算子的输入和输出数据。

  • 0:关闭,默认为0。
  • 1:开启。
配置示例:
custom_op.parameter_map["enable_exception_dump"].i = 1

训练

op_debug_config

Global Memory内存检测功能开关。

取值为.cfg配置文件路径,配置文件内多个选项用英文逗号分隔:

  • oom:在算子执行过程中,检测Global Memory是否内存越界
  • dump_bin:算子编译时,在当前执行路径下的kernel_meta文件夹中保留.o和.json文件
  • dump_cce:算子编译时,在当前执行路径下的kernel_meta文件夹中保留算子cce文件*.cce
  • dump_loc:算子编译时,在当前执行路径下的kernel_meta文件夹中保留python-cce映射文件*_loc.json
  • ccec_O0:算子编译时,开启ccec编译器选项-O0
  • ccec_g :算子编译时,开启ccec编译器选项-g

配置示例:

custom_op.parameter_map["op_debug_config"].s = tf.compat.as_bytes("/root/test0.cfg")

其中,test0.cfg文件信息为:

op_debug_config = ccec_O0,ccec_g,oom

训练/在线推理

debug_dir

用于配置保存算子编译生成的调试相关的过程文件的路径,包括算子.o/.json/.cce等文件。

默认生成在当前脚本执行路径下。

配置示例:

custom_op.parameter_map["debug_dir"].s = tf.compat.as_bytes("/home/test")

训练/在线推理