pull_blocks
函数功能
PagedAttention场景下,根据BlocksCacheKey,通过block列表的方式从对端节点拉取Cache到本地Cache。
函数原型
pull_blocks(self, src_cache_key: Union[CacheKey, CacheKeyByIdAndIndex, BlocksCacheKey], dst_cache: Cache, src_blocks: Optional[Union[Tuple[int], List[int]]] = (), dst_blocks: Union[Tuple[int], List[int]] = ()
参数说明
| 参数名称 | 数据类型 | 取值说明 | 
|---|---|---|
| src_cache_key | Union[CacheKey, CacheKeyByIdAndIndex, BlocksCacheKey] | 远端的Cache索引。 | 
| dst_cache | 目标Cache。 | |
| src_blocks | Optional[Union[Tuple[int], List[int]]] | 远端的block index列表, src_cache_key不是BlocksCacheKey时,不填。 | 
| dst_blocks | Union[Tuple[int], List[int]] | 本地的block index列表。 | 
调用示例
from llm_datadist import * ... cache_manager.pull_blocks(blocks_cache_key, cache, [0, 1], [2, 3])
约束说明
无
父主题: CacheManager