使用vLLM兼容OpenAI接口
本章节以v1/chat流式推理接口和v1/completions流式推理接口为例介绍接口调用,其他接口的调用方法请参见vLLM兼容OpenAI接口章节。
v1/chat流式推理接口
接口名 |
v1/chat流式推理接口 |
||
|---|---|---|---|
URL |
https://{服务IP地址}:{端口号}/v1/chat/completions |
||
请求类型 |
POST |
||
请求示例 |
|
||
返回示例 |
|
v1/completions流式推理接口
接口名 |
v1/completions流式推理接口 |
||
|---|---|---|---|
URL |
https://{服务IP地址}:{端口号}/v1/completions |
||
请求类型 |
POST |
||
请求示例 |
|
||
返回示例 |
|
父主题: 服务化接口调用