ascend_pytorch_profiler_{Rank_ID}.db数据
该文件为表结构文件,该文件推荐使用MindStudio Insight工具查看,也可以使用Navicat Premium等数据库开发工具直接打开。当前db文件汇总的性能数据如下:
STRING_IDS
字段名 |
类型 |
索引 |
含义 |
---|---|---|---|
id |
INTEGER |
主键 |
string对应的id |
value |
TEXT |
- |
string内容 |
PYTORCH_API
字段名 |
类型 |
含义 |
---|---|---|
startNs |
INTEGER |
op api开始时间,单位ns |
endNs |
INTEGER |
op api结束时间,单位ns |
globalTid |
INTEGER |
该api所属的全局tid。高32位:pid,低32位:tid |
connectionId |
INTEGER |
用于在CONNECTION_IDS表查询对应的connection_id;如果无connection_id,此处为空 |
name |
INTEGER |
该op api名,STRING_IDS(name) |
sequenceNumber |
INTEGER |
op序号 |
fwdThreadId |
INTEGER |
op前向线程id |
inputDtypes |
INTEGER |
输入数据类型,STRING_IDS(inputDtypes) |
inputShapes |
INTEGER |
输入shape,STRING_IDS(inputShapes) |
callchainId |
INTEGER |
用于在PYTORCH_CALLCHAINS表查询对应的call stack信息;如果无stack信息,此处为空 |
type |
INTEGER |
标记数据类型,op、queue、mstx还是python_trace,数据类型存于枚举表ENUM_API_TYPE中 |
CONNECTION_IDS
字段名 |
类型 |
含义 |
---|---|---|
id |
INTEGER |
对应PYTORCH_API表的connectionId |
connectionId |
INTEGER |
用于表示关联关系的id,当前包括task_queue、fwd_bwd、torch-cann-task三种关联关系 |
PYTORCH_CALLCHAINS
字段名 |
类型 |
含义 |
---|---|---|
id |
INTEGER |
对应PYTORCH_API表的callchainId |
stack |
INTEGER |
当前栈的字符串内容在STRING_IDS表中对应的id |
stackDepth |
INTEGER |
当前栈所在深度 |
MEMORY_RECORD
字段名 |
类型 |
含义 |
---|---|---|
component |
INTEGER |
组件名(GE、PTA、PTA+GE)在STRING_IDS表中对应的id |
timestamp |
INTEGER |
时间戳 |
totalAllocated |
INTEGER |
内存分配总额 |
totalReserved |
INTEGER |
内存预留总额 |
totalActive |
INTEGER |
PTA流申请的总内存 |
streamPtr |
INTEGER |
ascendcl流地址 |
deviceId |
INTEGER |
设备ID |
OP_MEMORY
字段名 |
类型 |
含义 |
---|---|---|
name |
INTEGER |
torch和GE算子名称,STRING_IDS(name) |
size |
INTEGER |
算子占用内存大小,单位Byte |
allocationTime |
INTEGER |
算子内存申请时间,单位ns |
releaseTime |
INTEGER |
算子内存释放时间,单位ns |
activeReleaseTime |
INTEGER |
内存实际归还内存池时间,单位ns |
duration |
INTEGER |
内存占用时间,单位ns |
activeDuration |
INTEGER |
内存实际占用时间,单位ns |
allocationTotalAllocated |
INTEGER |
算子内存分配时PTA和GE内存分配总额,单位Byte |
allocationTotalReserved |
INTEGER |
算子内存分配时PTA和GE内存占用总额,单位Byte |
allocationTotalActive |
INTEGER |
算子内存分配时当前流申请的内存总额,单位Byte |
releaseTotalAllocated |
INTEGER |
算子内存释放时PTA和GE内存分配总额,单位Byte |
releaseTotalReserved |
INTEGER |
算子内存释放时PTA和GE内存占用总额,单位Byte |
releaseTotalActive |
INTEGER |
算子内存释放时当前流申请的内存总额,单位Byte |
streamPtr |
INTEGER |
ascendcl流地址 |
deviceId |
INTEGER |
设备ID |
RANK_DEVICE_MAP
无Rank ID场景不生成该表。
字段名 |
类型 |
含义 |
---|---|---|
rankId |
INTEGER |
集群场景的节点识别ID |
deviceId |
INTEGER |
节点上的设备ID |
STEP_TIME
保存profiler采集step起始时间。
字段名 |
类型 |
含义 |
---|---|---|
id |
INTEGER |
step id值 |
startNs |
INTEGER |
step开始时间,单位ns |
endNs |
INTEGER |
step结束时间,单位ns |
GC_RECORD
保存profiler采集的GC事件。
字段名 |
类型 |
含义 |
---|---|---|
startNs |
INTEGER |
GC事件开始时间,单位ns |
endNs |
INTEGER |
GC事件结束时间,单位ns |
globalTid |
INTEGER |
GC事件的全局tid |
RoCE
字段名 |
类型 |
含义 |
---|---|---|
deviceId |
INTEGER |
设备ID |
timestampNs |
INTEGER |
本地时间,单位ns |
bandwidth |
INTEGER |
带宽,单位Byte/s |
rxPacketRate |
NUMERIC |
收包速率,单位packet/s |
rxByteRate |
NUMERIC |
接收字节速率,单位Byte/s |
rxPackets |
INTEGER |
累计收包数量,单位packet |
rxBytes |
INTEGER |
累计接收字节数量,单位Byte |
rxErrors |
INTEGER |
累计接收错误包数量,单位packet |
rxDropped |
INTEGER |
累计接收丢包数量,单位packet |
txPacketRate |
NUMERIC |
发包速率,单位packet/s |
txByteRate |
NUMERIC |
发送字节速率,单位Byte/s |
txPackets |
INTEGER |
累计发包数量,单位packet |
txBytes |
INTEGER |
累计发送字节数量,单位Byte |
txErrors |
INTEGER |
累计发送错误包数量,单位packet |
txDropped |
INTEGER |
累计发送丢包数量,单位packet |
funcId |
INTEGER |
端口号 |
NIC
字段名 |
类型 |
含义 |
---|---|---|
deviceId |
INTEGER |
设备ID |
timestampNs |
INTEGER |
本地时间,单位ns |
bandwidth |
INTEGER |
带宽,单位Byte/s |
rxPacketRate |
NUMERIC |
收包速率,单位packet/s |
rxByteRate |
NUMERIC |
接收字节速率,单位Byte/s |
rxPackets |
INTEGER |
累计收包数量,单位packet |
rxBytes |
INTEGER |
累计接收字节数量,单位Byte |
rxErrors |
INTEGER |
累计接收错误包数量,单位packet |
rxDropped |
INTEGER |
累计接收丢包数量,单位packet |
txPacketRate |
NUMERIC |
发包速率,单位packet/s |
txByteRate |
NUMERIC |
发送字节速率,单位Byte/s |
txPackets |
INTEGER |
累计发包数量,单位packet |
txBytes |
INTEGER |
累计发送字节数量,单位Byte |
txErrors |
INTEGER |
累计发送错误包数量,单位packet |
txDropped |
INTEGER |
累计发送丢包数量,单位packet |
funcId |
INTEGER |
端口号 |
HCCS
字段名 |
类型 |
含义 |
---|---|---|
deviceId |
INTEGER |
设备ID |
timestampNs |
INTEGER |
本地时间,单位ns |
txThroughput |
NUMERIC |
发送带宽,单位Byte/s |
rxThroughput |
NUMERIC |
接收带宽,单位Byte/s |
PCIE
字段名 |
类型 |
含义 |
---|---|---|
deviceId |
INTEGER |
设备ID |
timestampNs |
INTEGER |
本地时间,单位ns |
txPostMin |
NUMERIC |
发送端PCIe Post数据传输带宽最小值,单位Byte/s |
txPostMax |
NUMERIC |
发送端PCIe Post数据传输带宽最大值,单位Byte/s |
txPostAvg |
NUMERIC |
发送端PCIe Post数据传输带宽平均值,单位Byte/s |
txNonpostMin |
NUMERIC |
发送端PCIe Non-Post数据传输带宽最小值,单位Byte/s |
txNonpostMax |
NUMERIC |
发送端PCIe Non-Post数据传输带宽最大值,单位Byte/s |
txNonpostAvg |
NUMERIC |
发送端PCIe Non-Post数据传输带宽平均值,单位Byte/s |
txCplMin |
NUMERIC |
发送端接收写请求的完成数据包最小值,单位Byte/s |
txCplMax |
NUMERIC |
发送端接收写请求的完成数据包最大值,单位Byte/s |
txCplAvg |
NUMERIC |
发送端接收写请求的完成数据包平均值,单位Byte/s |
txNonpostLatencyMin |
NUMERIC |
发送端PCIe Non-Post模式下的传输时延最小值,单位ns |
txNonpostLatencyMax |
NUMERIC |
发送端PCIe Non-Post模式下的传输时延最大值,单位ns |
txNonpostLatencyAvg |
NUMERIC |
发送端PCIe Non-Post模式下的传输时延平均值,单位ns |
rxPostMin |
NUMERIC |
接收端PCIe Post数据传输带宽最小值,单位Byte/s |
rxPostMax |
NUMERIC |
接收端PCIe Post数据传输带宽最大值,单位Byte/s |
rxPostAvg |
NUMERIC |
接收端PCIe Post数据传输带宽平均值,单位Byte/s。 |
rxNonpostMin |
NUMERIC |
接收端PCIe Non-Post数据传输带宽最小值,单位Byte/s |
rxNonpostMax |
NUMERIC |
接收端PCIe Non-Post数据传输带宽最大值,单位Byte/s |
rxNonpostAvg |
NUMERIC |
接收端PCIe Non-Post数据传输带宽平均值,单位Byte/s |
rxCplMin |
NUMERIC |
接收端收到写请求的完成数据包最小值,单位Byte/s |
rxCplMax |
NUMERIC |
接收端收到写请求的完成数据包最大值,单位Byte/s |
rxCplAvg |
NUMERIC |
接收端收到写请求的完成数据包平均值,单位Byte/s |