PullKv

从Prompt cluster拉取该request对应的KV到本Decode cluster的暂存区中，每次调用成功后都会覆盖暂存区之前的KV。

ge::Status PullKv(const LLMReq &req, uint64_t model_id = 0UL)

参数名	输入/输出	描述
req	输入	当前执行的请求。类型LLMReq。
model_id	输入	模型ID，默认为0。

拉取KV的结果，取值如下：

无

必须先做初始化和linkclusters后才能调用。

只能在LLM_OPTION_ROLE为DECODER的时候调用并且在LLM_OPTION_BATCH_MODE为auto的时候调用，否则会报错。

只有一个暂存区，连续调用时，后续的调用会覆盖暂存区之前的KV。

父主题： LLMEngine