查询服务元数据

接口功能

查询服务元数据信息。

接口格式

操作类型:GET

URL:https://{ip}:{port}/v2

请求参数

使用样例

请求样例:

GET https://{ip}:{port}/v2

响应样例:

{
    "name": "MindIE Server",
    "version": "{version}",
    "extensions": {
        "max_iter_times": 512,  
        "prefill_policy_type": 0,
        "decode_policy_type": 0,
        "max_prefill_batch_size": 50,
        "max_prefill_tokens": 8192
    }
}

响应状态码:200

输出说明

参数

类型

说明

name

string

服务名称,暂定"MindIE Server"。

version

string

服务版本。

extensions

object

扩展字段。

max_iter_times

int

最大可进行的decode次数。

prefill_policy_type

int

prefill阶段的调度策略。

decode_policy_type

int

decode阶段的调度策略。

max_prefill_batch_size

int

最大prefill batch size。

max_prefill_tokens

int

最大prefill token数量。