昇腾社区首页
中文
注册

AscendIndexInt8IVFFlatConfig

API定义

inline AscendIndexInt8IVFFlatConfig(std::vector<int> devices, int64_t resourceSize = INT8_IVFFLAT_DEFAULT_MEM)

功能描述

AscendIndexInt8IVFFlatConfig的构造函数,生成AscendIndexInt8IVFFlatConfig指定NPU侧芯片资源和配置资源池大小。

输入

std::vector<int> devices:NPU侧芯片资源。

int64_t resourceSize:设备侧预置的内存池大小,单位为Byte,计算过程中存储中间结果的内存空间,用于避免过程中动态申请内存造成性能波动。默认参数为头文件中的“INT8_IVFFLAT_DEFAULT_MEM”。该参数通过底库大小和search的batch数共同确定,在底库大于或等于1000万且batch数大于或等于16时建议设置1024MB。

输出

返回值

约束说明

  • “devices”需要为合法有效的芯片ID。
  • “resourceSize”配置的值不超过1024MB(1024*1024*1024字节)。