ArithmeticUtilization(cube及vector类型指令耗时和占比)
cube及vector类型指令的cycle占比数据ArithmeticUtilization.csv,建议优化算子逻辑,减少冗余计算指令。
示例仅展示部分参数,详情介绍请参见下表中的字段说明。
Atlas A2训练系列产品/Atlas 800I A2推理产品
图1 ArithmeticUtilization.csv文件
关键字段说明如下。
|
字段名 |
字段解释 |
|---|---|
|
block_id |
Task运行切分数量,对应Task运行时配置的核数。 |
|
sub_block_id |
Task运行使用的每个block名称和序号。 |
|
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
|
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
|
aiv_time(us) |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行时间,单位us。 |
|
aiv_total_cycles |
该Task被分配到每个AI Vector Core计算单元上后,每个AI Vector Core计算单元上的执行的cycle总数。 |
|
此处ArithmeticUtilization性能指标采集项的更多参数解析参见Atlas A2训练系列产品/Atlas 800...。 |
|
Atlas 推理系列产品
图2 ArithmeticUtilization.csv文件
关键字段说明如下。
|
字段名 |
字段解释 |
|---|---|
|
aic_time(us) |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行时间,单位us。 |
|
aic_total_cycles |
该Task被分配到每个AI Core计算单元上后,每个AI Core计算单元上的执行的cycle总数。 |
|
此处ArithmeticUtilization性能指标采集项的更多参数解析参见Atlas 推理系列产品。 |
|
父主题: msprof op