RegisterKvCache
产品支持情况
产品 |
是否支持 |
|---|---|
Atlas 350 加速卡 |
x |
√ |
|
√ |
|
x |
|
x |
|
x |
说明:针对
函数功能
注册本地KV Cache内存。
函数原型
1 2 3 4 | Status RegisterKvCache(const CacheDesc &cache_desc, const std::vector<uint64_t> &addrs, const RegisterCfg &cfg, int64_t &cache_id); |
参数说明
参数名称 |
输入/输出 |
取值说明 |
|---|---|---|
cache_desc |
输入 |
本地Cache的描述信息。 |
addrs |
输入 |
本地Cache的地址。地址个数不超过240。 |
cfg |
输入 |
预留参数。 |
cache_id |
输出 |
注册的Cache的ID。可用于后续调用传输kv接口时构造Cache。 |
返回值
- LLM_SUCCESS:成功
- 其他:失败
约束说明
需要在Initialize接口初始化完成后调用。
当HDK版本低于25.5.0时,最大注册20GB的Host内存;当HDK版本等于或大于25.5.0时,最大注册1TB的Host内存。注册内存越大,占用的OS内存越多。该约束支持的型号如下:
Atlas A2 训练系列产品 /Atlas A2 推理系列产品 Atlas A3 训练系列产品 /Atlas A3 推理系列产品
父主题: LLM-DataDist接口