copy_blocks
函数功能
PagedAttention场景下,拷贝block。
函数原型
copy_blocks(cache: KvCache, copy_block_info: Dict[int, List[int]])
参数说明
参数名称 |
数据类型 |
取值说明 |
---|---|---|
cache |
目标Cache。 |
|
copy_block_info |
Dict[int, List[int]] |
dict里面内容代表(原始block index,目标block index列表)。 |
调用示例
1 2 3 | from llm_datadist import *
...
kv_cache_manager.copy_blocks(kv_cache, {1: [2,3]})
|
约束说明
本接口不支持并发,并发会排队等待。
父主题: KvCacheManager