在KvCache管理模式下,请求释放所占内存。
complete_request(llm_req: LLMReq)
参数名称 |
数据类型 |
取值说明 |
---|---|---|
llm_req |
请求信息。 |
1 2 3 4 5 | from llm_datadist import LLMDataDist, LLMRole, LLMReq llm_datadist = LLMDataDist(LLMRole.DECODER, 0) ... llm_req = LLMReq() llm_datadist.complete_request(llm_req) |
无
无