提前终止请求接口
接口功能
参考Triton接口定义,提供提前终止请求接口。
接口格式
操作类型:POST
URL:https://{ip}:{port}/v2/models/${MODEL_NAME}[/versions/${MODEL_VERSION}]/stopInfer
请求参数
参数 |
是否必选 |
说明 |
取值要求 |
|---|---|---|---|
id |
必选 |
推理请求id。 |
字符串。 |
[/versions/${MODEL_VERSION}]字段暂不支持,不传递。
使用样例
请求样例:
POST https://<ip>:<port>/v2/models/llama_65b/stopInfer
请求消息体:
{
"id":"a123"
}
响应样例:
{
"id":"a123"
}
响应状态码:200
输出说明
返回值 |
类型 |
说明 |
|---|---|---|
id |
string |
成功停止推理请求id。 |
父主题: 自研接口