将CPU或GPU与NPU的dump文件进行比对,支持单卡和多卡,可同时比对多卡的dump数据。多机场景需要每个设备单独执行比对操作。可自动检索和匹配对应卡和进程所dump的数据文件,再调用compare进行比对。单机单卡时与compare函数二选一。
compare_distributed(npu_dump_dir, bench_dump_dir, output_path, **kwargs)
参数名 |
说明 |
是否必选 |
---|---|---|
npu_dump_dir |
配置NPU环境下的dump目录。参数示例:'./npu_dump/ptdbg_dump_v4.0'。 |
是 |
bench_dump_dir |
配置CPU、GPU或NPU环境下的dump目录。参数示例:'./gpu_dump/ptdbg_dump_v4.0'。 |
是 |
output_path |
配置比对结果csv文件存盘目录。需要预先创建output_path目录。参数示例:'./output'。文件名称基于时间戳自动生成,格式为:compare_result_rank{npu_ID}-rank{cpu/gpu/npu_ID}_{timestamp}.csv。 |
是 |
**kwargs |
支持compare的所有可选参数。 |
否 |
创建比对脚本,例如compare_distributed.py,拷贝如下代码,具体参数请根据实际环境修改。
from ptdbg_ascend import * compare_distributed('./npu_dump/ptdbg_dump_v4.0', './gpu_dump/ptdbg_dump_v4.0', './output')