compare_distributed

功能说明

将CPU或GPU与NPU的dump文件进行比对,支持单卡和多卡,可同时比对多卡的dump数据。多机场景需要每个设备单独执行比对操作。可自动检索和匹配对应卡和进程所dump的数据文件,再调用compare进行比对。单机单卡时与compare函数二选一。

原型

compare_distributed(npu_dump_dir, bench_dump_dir, output_path, **kwargs)
表1 参数说明

参数名

说明

是否必选

npu_dump_dir

配置NPU环境下的dump目录。参数示例:'./npu_dump/ptdbg_dump_v4.0'。

bench_dump_dir

配置CPU、GPU或NPU环境下的dump目录。参数示例:'./gpu_dump/ptdbg_dump_v4.0'。

output_path

配置比对结果csv文件存盘目录。需要预先创建output_path目录。参数示例:'./output'。文件名称基于时间戳自动生成,格式为:compare_result_rank{npu_ID}-rank{cpu/gpu/npu_ID}_{timestamp}.csv。

**kwargs

支持compare的所有可选参数。

函数示例

创建比对脚本,例如compare_distributed.py,拷贝如下代码,具体参数请根据实际环境修改。

from ptdbg_ascend import *
compare_distributed('./npu_dump/ptdbg_dump_v4.0', './gpu_dump/ptdbg_dump_v4.0', './output')