根据cache_manager中的npu_mem和cpu_mem申请npu和cpu对应的kvcache。(属于内部调度接口,暂不支持对外功能。)
1 2 3 4 | def update_cache_policy(self, cache_manager): self.cache_pool = CachePool(cache_manager, self.device) self.cache_pool.allocate_cpu_cache() self.cache_pool.allocate_npu_cache() |
参数名称 |
是否必选 |
类型 |
默认值 |
描述 |
---|---|---|---|---|
cache_manager |
是 |
CacheManager |
- |
根据模型信息进行npu和cpu的block的计算,接口需配合llm的调度模块,当前作为内部实现。 |