ascend_pytorch_profiler_{Rank_ID}.db数据
该文件为表结构文件,该文件推荐使用MindStudio Insight工具查看,也可以使用Navicat Premium等数据库开发工具直接打开。当前db文件汇总的性能数据如下:
STRING_IDS
字段名  | 
类型  | 
索引  | 
含义  | 
|---|---|---|---|
id  | 
INTEGER  | 
主键  | 
string对应的id  | 
value  | 
TEXT  | 
-  | 
string内容  | 
PYTORCH_API
字段名  | 
类型  | 
含义  | 
|---|---|---|
startNs  | 
INTEGER  | 
op API开始时间,单位ns  | 
endNs  | 
INTEGER  | 
op API结束时间,单位ns  | 
globalTid  | 
INTEGER  | 
该API所属的全局tid。高32位:pid,低32位:tid  | 
connectionId  | 
INTEGER  | 
用于在CONNECTION_IDS表查询对应的connection_id;如果无connection_id,此处为空  | 
name  | 
INTEGER  | 
该op API名,STRING_IDS(name)  | 
sequenceNumber  | 
INTEGER  | 
op序号  | 
fwdThreadId  | 
INTEGER  | 
op前向线程id  | 
inputDtypes  | 
INTEGER  | 
输入数据类型,STRING_IDS(inputDtypes)  | 
inputShapes  | 
INTEGER  | 
输入shape,STRING_IDS(inputShapes)  | 
callchainId  | 
INTEGER  | 
用于在PYTORCH_CALLCHAINS表查询对应的call stack信息;如果无stack信息,此处为空  | 
type  | 
INTEGER  | 
标记数据类型,op、queue、mstx还是python_trace,数据类型存于枚举表ENUM_API_TYPE中  | 
CONNECTION_IDS
字段名  | 
类型  | 
含义  | 
|---|---|---|
id  | 
INTEGER  | 
对应PYTORCH_API表的connectionId  | 
connectionId  | 
INTEGER  | 
用于表示关联关系的id,当前包括task_queue、fwd_bwd、torch-cann-task三种关联关系  | 
PYTORCH_CALLCHAINS
字段名  | 
类型  | 
含义  | 
|---|---|---|
id  | 
INTEGER  | 
对应PYTORCH_API表的callchainId  | 
stack  | 
INTEGER  | 
当前栈的字符串内容在STRING_IDS表中对应的id  | 
stackDepth  | 
INTEGER  | 
当前栈所在深度  | 
MEMORY_RECORD
字段名  | 
类型  | 
含义  | 
|---|---|---|
component  | 
INTEGER  | 
组件名(GE、PTA、PTA+GE)在STRING_IDS表中对应的id  | 
timestamp  | 
INTEGER  | 
时间戳  | 
totalAllocated  | 
INTEGER  | 
内存分配总额  | 
totalReserved  | 
INTEGER  | 
内存预留总额  | 
totalActive  | 
INTEGER  | 
PTA流申请的总内存  | 
streamPtr  | 
INTEGER  | 
ascendcl流地址  | 
deviceId  | 
INTEGER  | 
设备ID  | 
OP_MEMORY
字段名  | 
类型  | 
含义  | 
|---|---|---|
name  | 
INTEGER  | 
torch和GE算子名称,STRING_IDS(name)  | 
size  | 
INTEGER  | 
算子占用内存大小,单位Byte  | 
allocationTime  | 
INTEGER  | 
算子内存申请时间,单位ns  | 
releaseTime  | 
INTEGER  | 
算子内存释放时间,单位ns  | 
activeReleaseTime  | 
INTEGER  | 
内存实际归还内存池时间,单位ns  | 
duration  | 
INTEGER  | 
内存占用时间,单位ns  | 
activeDuration  | 
INTEGER  | 
内存实际占用时间,单位ns  | 
allocationTotalAllocated  | 
INTEGER  | 
算子内存分配时PTA和GE内存分配总额,单位Byte  | 
allocationTotalReserved  | 
INTEGER  | 
算子内存分配时PTA和GE内存占用总额,单位Byte  | 
allocationTotalActive  | 
INTEGER  | 
算子内存分配时当前流申请的内存总额,单位Byte  | 
releaseTotalAllocated  | 
INTEGER  | 
算子内存释放时PTA和GE内存分配总额,单位Byte  | 
releaseTotalReserved  | 
INTEGER  | 
算子内存释放时PTA和GE内存占用总额,单位Byte  | 
releaseTotalActive  | 
INTEGER  | 
算子内存释放时当前流申请的内存总额,单位Byte  | 
streamPtr  | 
INTEGER  | 
ascendcl流地址  | 
deviceId  | 
INTEGER  | 
设备ID  | 
RANK_DEVICE_MAP
无Rank ID场景不生成该表。
字段名  | 
类型  | 
含义  | 
|---|---|---|
rankId  | 
INTEGER  | 
集群场景的节点标识ID  | 
deviceId  | 
INTEGER  | 
节点上的设备ID  | 
STEP_TIME
保存profiler采集step起始时间。
字段名  | 
类型  | 
含义  | 
|---|---|---|
id  | 
INTEGER  | 
Step ID值  | 
startNs  | 
INTEGER  | 
Step开始时间,单位ns  | 
endNs  | 
INTEGER  | 
Step结束时间,单位ns  | 
GC_RECORD
保存profiler采集的GC事件。
字段名  | 
类型  | 
含义  | 
|---|---|---|
startNs  | 
INTEGER  | 
GC事件开始时间,单位ns  | 
endNs  | 
INTEGER  | 
GC事件结束时间,单位ns  | 
globalTid  | 
INTEGER  | 
GC事件的全局tid  | 
ROCE
字段名  | 
类型  | 
含义  | 
|---|---|---|
deviceId  | 
INTEGER  | 
设备ID  | 
timestampNs  | 
INTEGER  | 
本地时间,单位ns  | 
bandwidth  | 
INTEGER  | 
带宽,单位Byte/s  | 
rxPacketRate  | 
NUMERIC  | 
收包速率,单位packet/s  | 
rxByteRate  | 
NUMERIC  | 
接收字节速率,单位Byte/s  | 
rxPackets  | 
INTEGER  | 
累计收包数量,单位packet  | 
rxBytes  | 
INTEGER  | 
累计接收字节数量,单位Byte  | 
rxErrors  | 
INTEGER  | 
累计接收错误包数量,单位packet  | 
rxDropped  | 
INTEGER  | 
累计接收丢包数量,单位packet  | 
txPacketRate  | 
NUMERIC  | 
发包速率,单位packet/s  | 
txByteRate  | 
NUMERIC  | 
发送字节速率,单位Byte/s  | 
txPackets  | 
INTEGER  | 
累计发包数量,单位packet  | 
txBytes  | 
INTEGER  | 
累计发送字节数量,单位Byte  | 
txErrors  | 
INTEGER  | 
累计发送错误包数量,单位packet  | 
txDropped  | 
INTEGER  | 
累计发送丢包数量,单位packet  | 
funcId  | 
INTEGER  | 
端口号  | 
NIC
字段名  | 
类型  | 
含义  | 
|---|---|---|
deviceId  | 
INTEGER  | 
设备ID  | 
timestampNs  | 
INTEGER  | 
本地时间,单位ns  | 
bandwidth  | 
INTEGER  | 
带宽,单位Byte/s  | 
rxPacketRate  | 
NUMERIC  | 
收包速率,单位packet/s  | 
rxByteRate  | 
NUMERIC  | 
接收字节速率,单位Byte/s  | 
rxPackets  | 
INTEGER  | 
累计收包数量,单位packet  | 
rxBytes  | 
INTEGER  | 
累计接收字节数量,单位Byte  | 
rxErrors  | 
INTEGER  | 
累计接收错误包数量,单位packet  | 
rxDropped  | 
INTEGER  | 
累计接收丢包数量,单位packet  | 
txPacketRate  | 
NUMERIC  | 
发包速率,单位packet/s  | 
txByteRate  | 
NUMERIC  | 
发送字节速率,单位Byte/s  | 
txPackets  | 
INTEGER  | 
累计发包数量,单位packet  | 
txBytes  | 
INTEGER  | 
累计发送字节数量,单位Byte  | 
txErrors  | 
INTEGER  | 
累计发送错误包数量,单位packet  | 
txDropped  | 
INTEGER  | 
累计发送丢包数量,单位packet  | 
funcId  | 
INTEGER  | 
端口号  | 
HCCS
字段名  | 
类型  | 
含义  | 
|---|---|---|
deviceId  | 
INTEGER  | 
设备ID  | 
timestampNs  | 
INTEGER  | 
本地时间,单位ns  | 
txThroughput  | 
NUMERIC  | 
发送带宽,单位Byte/s  | 
rxThroughput  | 
NUMERIC  | 
接收带宽,单位Byte/s  | 
PCIE
字段名  | 
类型  | 
含义  | 
|---|---|---|
deviceId  | 
INTEGER  | 
设备ID  | 
timestampNs  | 
INTEGER  | 
本地时间,单位ns  | 
txPostMin  | 
NUMERIC  | 
发送端PCIe Post数据传输带宽最小值,单位Byte/s  | 
txPostMax  | 
NUMERIC  | 
发送端PCIe Post数据传输带宽最大值,单位Byte/s  | 
txPostAvg  | 
NUMERIC  | 
发送端PCIe Post数据传输带宽平均值,单位Byte/s  | 
txNonpostMin  | 
NUMERIC  | 
发送端PCIe Non-Post数据传输带宽最小值,单位Byte/s  | 
txNonpostMax  | 
NUMERIC  | 
发送端PCIe Non-Post数据传输带宽最大值,单位Byte/s  | 
txNonpostAvg  | 
NUMERIC  | 
发送端PCIe Non-Post数据传输带宽平均值,单位Byte/s  | 
txCplMin  | 
NUMERIC  | 
发送端接收写请求的完成数据包最小值,单位Byte/s  | 
txCplMax  | 
NUMERIC  | 
发送端接收写请求的完成数据包最大值,单位Byte/s  | 
txCplAvg  | 
NUMERIC  | 
发送端接收写请求的完成数据包平均值,单位Byte/s  | 
txNonpostLatencyMin  | 
NUMERIC  | 
发送端PCIe Non-Post模式下的传输时延最小值,单位ns  | 
txNonpostLatencyMax  | 
NUMERIC  | 
发送端PCIe Non-Post模式下的传输时延最大值,单位ns  | 
txNonpostLatencyAvg  | 
NUMERIC  | 
发送端PCIe Non-Post模式下的传输时延平均值,单位ns  | 
rxPostMin  | 
NUMERIC  | 
接收端PCIe Post数据传输带宽最小值,单位Byte/s  | 
rxPostMax  | 
NUMERIC  | 
接收端PCIe Post数据传输带宽最大值,单位Byte/s  | 
rxPostAvg  | 
NUMERIC  | 
接收端PCIe Post数据传输带宽平均值,单位Byte/s。  | 
rxNonpostMin  | 
NUMERIC  | 
接收端PCIe Non-Post数据传输带宽最小值,单位Byte/s  | 
rxNonpostMax  | 
NUMERIC  | 
接收端PCIe Non-Post数据传输带宽最大值,单位Byte/s  | 
rxNonpostAvg  | 
NUMERIC  | 
接收端PCIe Non-Post数据传输带宽平均值,单位Byte/s  | 
rxCplMin  | 
NUMERIC  | 
接收端收到写请求的完成数据包最小值,单位Byte/s  | 
rxCplMax  | 
NUMERIC  | 
接收端收到写请求的完成数据包最大值,单位Byte/s  | 
rxCplAvg  | 
NUMERIC  | 
接收端收到写请求的完成数据包平均值,单位Byte/s  |