服务指标接口(JSON格式)
接口功能
获取推理服务过程中请求的TTFT、TBT的动态平均值(默认近1000个请求的平均值),正在执行请求数、正在等待请求数量、剩余NPUblock数量。
接口格式
操作类型:GET
URL:https://{ip}:{port}/metrics-json
 - {ip}字段优先读取环境变量值MIES_CONTAINER_MANAGEMENT_IP;如果没有该环境变量,则取配置文件的“managementIpAddress”参数;如果配置文件中没有“managementIpAddress”参数,则取配置文件的“ipAddress”参数。
 - {port}字段优先读取配置文件的“managementPort”参数;如果配置文件中没有“managementPort”参数,则取配置文件的“port”参数。
 
请求参数
无
使用样例
请求样例:
GET https://{ip}:{port}/metrics-json
响应样例:
{
    "resultType": "vector",
    "result": [
        {
            "metric": [
                {
                    "__name__": "TTFT",
                    "job": "node",
                    "instance": "127.0.0.2:1026"
                }
            ],
            "value": "0"
        },
        {
            "metric": [
                {
                    "__name__": "TBT",
                    "job": "node",
                    "instance": "127.0.0.2:1026"
                }
            ],
            "value": "0"
        },
        {
            "metric": [
                {
                    "__name__": "waitingInferRequestNum",
                    "job": "node",
                    "instance": "127.0.0.2:1026"
                }
            ],
            "value": "0"
        },
        {
            "metric": [
                {
                    "__name__": "processingInferRequestNum",
                    "job": "node",
                    "instance": "127.0.0.2:1026"
                }
            ],
            "value": "0"
        },
        {
            "metric": [
                {
                    "__name__": "remainBlocks",
                    "job": "node",
                    "instance": "127.0.0.2:1026"
                }
            ],
            "value": "1024"
        }
    ]
}
响应状态码:200
输出说明
返回值  | 
类型  | 
说明  | 
||
|---|---|---|---|---|
resultType  | 
string  | 
结果类型,默认为vector,包含查询结果的数组。  | 
||
result  | 
list  | 
结果列表。  | 
||
-  | 
metric  | 
list  | 
五种服务指标结果。 
  | 
|
-  | 
__name__  | 
string  | 
服务指标的名称。  | 
|
job  | 
string  | 
服务指标作业名称。  | 
||
instance  | 
string  | 
服务指标实例地址。  | 
||
value  | 
string  | 
服务指标结果具体值。  | 
||
父主题: EndPoint管理面接口