KvCacheExtParam
调用Pull或Push相关接口时传入的扩展参数。
1 2 3 4 5 6 | struct KvCacheExtParam { std::pair<int32_t, int32_t> src_layer_range = {-1, -1}; // KV传输时源端的层数范围 std::pair<int32_t, int32_t> dst_layer_range{-1, -1}; // KV传输时目的端的层数范围 uint8_t tensor_num_per_layer = 2U; // KV传输时一层的tensor数量 uint8_t reserved[127]; // 预留字段 } |
父主题: 数据结构