昇腾社区首页
中文
注册

错误码展示方式说明

Server组件后6位错误码,16进制。以010201为例,各段含义如表1所示。

表1 错误码各段说明

错误码字段

说明

第1-2位

子组件编码。编码参考:

  • 01:daemon
  • 02:endpoint
  • 03:config
  • 04:tokenizer
  • 05:gmis
  • 06:infer_backend_manager
  • 11:batchscheduler
  • 12:backend_model
  • 13:model_wrapper
  • 14:profiler
  • 21:llm_infer_engine
  • 22:mock_infer_engine

第3-4位

业务阶段。编码参考:

  • 01:服务启动
  • 02:业务请求
  • 03:管理请求
  • 04:单机推理
  • 05:多机推理
  • 06:Tokenizer
  • 07:Detokenizer
  • 08:响应处理
  • 09:PD分离Split wise
  • 0A:Split fuse
  • 0B:Prefix cache
  • 0C:资源抢占
  • 0D:重计算Recompute
  • 0E:调度策略FCFS等
  • 0F:Profiling
  • 10:热配置
  • 11:安全相关

第5-6位

错误类型。编码参考:

  • 01:权限错误
  • 02:子进程异常
  • 03:推理服务拉起异常
  • 04:参数解析异常
  • 05:推理请求生成异常
  • 06:状态告警
  • 07:校验失败
  • 08:组件调用异常
  • 09:库调用异常
  • 0A:Tensor添加/获取异常
  • 0B:Encode/Decode异常
  • 0C:响应处理异常
  • 0D:响应生成异常
  • 0E:JSON解析异常
  • 0F:超时告警
  • 10:空响应告警
  • 11:Pull KV告警
  • 12:重计算告警
  • 13:安全相关异常
  • 14:异常传递
  • 15:校验告警
  • 16:未知错误
  • 17:下载异常
  • 18:删除异常
  • 19:等待子进程告警
  • 1A:子进程退出告警
  • 1B:配置错误
  • 1C:初始化异常
  • 1D:服务停止异常
  • 1E:子节点异常