昇腾社区首页
中文
注册
开发者
下载

查询指定芯片ECC错误计数

功能说明

npu-smi info -t ecc -i id -c chip_id用于查询某个芯片的ECC错误计数。

命令格式

npu-smi info -t ecc -i id -c chip_id

参数说明

类型

描述

id

设备ID。通过npu-smi info -l命令查出的NPU ID即为设备ID。

chip_id

芯片ID。通过npu-smi info -m命令查出的Chip ID即为芯片ID。

该命令不支持指定MCU。

使用指南

表1 Atlas 200I DK A2 开发者套件Atlas 500 A2 智能小站Atlas 200I A2 加速模块(RC场景)不同部署场景下的支持情况

物理机场景(裸机)

物理机+普通容器场景

直通虚拟机场景

root用户

运行用户组(非root用户)

root用户

root用户

Y

Y

N

NA

注:Y表示支持;N表示不支持;NA表示不涉及,当前未规划此场景。

表2 Atlas 200I A2 加速模块(EP场景)不同部署场景下的支持情况

物理机场景(裸机)

物理机+普通容器场景

直通虚拟机场景

root用户

运行用户组(非root用户)

root用户

root用户

Y

Y

Y

Y

注:Y表示支持;N表示不支持;NA表示不涉及,当前未规划此场景。

使用示例

查询设备0中编号为0的芯片的ECC错误计数。

npu-smi info -t ecc -i 0 -c 0
        Single-bit Error Count                   : 0
        Double-bit Error Count                   : 0

输出说明

表3 打印信息说明

字段

说明

Single-bit Error Count

单比特错误数量

Double-bit Error Count

多比特错误数量