性能数据文件参考
总体说明
msprof(timeline数据总表)
性能调优建议
msproftx数据说明
task_time(任务调度信息)
api_statistic(API耗时统计信息)
step_trace(迭代轨迹信息)
dp(数据增强信息)
hccl_statistic(集合通信算子统计信息)
op_summary(算子详细信息)
op_statistic(算子调用次数及耗时)
ai_core_utilization(AI Core指令占比)
ai_vector_core_utilization(AI Vector Core指令占比)
aicpu(AI CPU算子详细耗时)
aicpu_mi(数据准备的队列)
l2_cache(L2 Cache命中率)
fusion_op(算子融合信息)
npu_mem(NPU内存占用)
npu_module_mem(NPU组件内存占用)
memory_record(CANN算子的内存占用记录)
operator_memory(CANN算子的内存占用明细)
static_op_mem(静态图算子内存)
sys_mem(系统内存数据)
process_mem(进程内存占用数据)
cpu_usage(AI CPU、Ctrl CPU利用率)
process_cpu_usage(进程CPU占用率)
片上内存读写速率
hccs(集合通信带宽)
nic(每个时间节点网络信息)
roce(RoCE通信接口带宽)
pcie(PCIe带宽)
biu_group/aic_core_group/aiv_core_group(AI Core和AI Vector的带宽和延时)
Acc PMU(加速器带宽及并发信息)
Stars Soc Info(SoC传输带宽信息)
Stars Chip Trans(片间传输带宽信息)
llc_read_write(三级缓存读写速率)
llc_bandwidth(三级缓存带宽)
llc_aicpu(AI CPU的三级缓存使用量)
llc_ctrlcpu(Control CPU三级缓存使用量)
dvpp(DVPP信息)
ai_cpu_top_function(AI CPU热点函数)
ai_cpu_pmu_events(AI CPU PMU事件)
ctrl_cpu_top_function(Ctrl CPU热点函数)
ctrl_cpu_pmu_events(Ctrl CPU PMU事件)
ts_cpu_top_function(TS CPU热点函数)
ts_cpu_pmu_events(TS CPU PMU事件)
host_cpu_usage(Host侧CPU利用率)
host_mem_usage(Host侧内存利用率)
host_disk_usage(Host侧磁盘I/O利用率)
host_network_usage(Host侧网络I/O利用率)
os_runtime_statistic(Host侧syscall和pthreadcall)
cpu_usage(Host侧系统CPU利用率)
process_cpu_usage(Host侧进程CPU利用率)
sys_mem(Host侧系统内存利用率)
process_mem(Host侧进程内存利用率)
父主题:
性能分析工具