服务指标接口(JSON格式)
接口功能
获取推理服务过程中请求的TTFT、TBT的动态平均值(默认近1000个请求的平均值),正在执行请求数、正在等待请求数量、剩余NPUblock数量。
接口格式
操作类型:GET
URL:https://{ip}:{port}/metrics-json
- {ip}字段优先读取环境变量值MIES_CONTAINER_MANAGEMENT_IP;如果没有该环境变量,则取配置文件的“managementIpAddress”参数;如果配置文件中没有“managementIpAddress”参数,则取配置文件的“ipAddress”参数。
- {port}字段优先读取配置文件的“managementPort”参数;如果配置文件中没有“managementPort”参数,则取配置文件的“port”参数。
请求参数
无
使用样例
请求样例:
GET https://{ip}:{port}/metrics-json
响应样例:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 | { "resultType": "vector", "result": [ { "metric": [ { "__name__": "TTFT", "job": "node", "instance": "127.0.0.2:1026" } ], "value": "0" }, { "metric": [ { "__name__": "TBT", "job": "node", "instance": "127.0.0.2:1026" } ], "value": "0" }, { "metric": [ { "__name__": "waitingInferRequestNum", "job": "node", "instance": "127.0.0.2:1026" } ], "value": "0" }, { "metric": [ { "__name__": "processingInferRequestNum", "job": "node", "instance": "127.0.0.2:1026" } ], "value": "0" }, { "metric": [ { "__name__": "remainBlocks", "job": "node", "instance": "127.0.0.2:1026" } ], "value": "1024" } ] } |
响应状态码:200
输出说明
返回值 |
类型 |
说明 |
||
|---|---|---|---|---|
resultType |
string |
结果类型,默认为vector,包含查询结果的数组。 |
||
result |
list |
结果列表。 |
||
- |
metric |
list |
五种服务指标结果。
|
|
- |
__name__ |
string |
服务指标的名称。 |
|
job |
string |
服务指标作业名称。 |
||
instance |
string |
服务指标实例地址。 |
||
value |
string |
服务指标结果具体值。 |
||
父主题: EndPoint内部接口