昇腾社区首页
中文
注册

AscendIndexBinaryFlatConfig

AscendIndexBinaryFlat需要使用对应的AscendIndexBinaryFlatConfig执行对应资源的初始化,配置执行检索过程中的硬件资源“devices”和预置的内存池大小“resources”

  • AscendIndexBinaryFlat仅支持单个昇腾AI处理器Atlas 推理系列产品,依赖AICPU算子和BinaryFlat算子,请参考自定义算子介绍生成对应算子。
  • AscendIndexBinaryFlat仅支持标准态部署方式。

成员介绍

成员

类型

说明

deviceList

std::vector<int>

Device侧设备ID。

AscendIndexBinaryFlat类仅支持单个Atlas 推理系列产品的加速卡。

resourceSize

int64_t

Device侧内存池大小,单位为字节,默认参数值为1024MB,合法范围为[1024*1024*1024, 32*1024*1024*1024],10million底库推荐申请5GB。

接口说明

API定义

AscendIndexBinaryFlatConfig() = default;

功能描述

默认构造函数,默认devices为{ 0 },使用第0个昇腾AI处理器进行计算,默认resources为1024MB。

输入

输出

返回值

约束说明

AscendIndexBinaryFlat仅支持单个昇腾AI处理器Atlas 推理系列产品,如果第0个昇腾AI处理器不可用则无法使用默认构造。

API定义

AscendIndexBinaryFlatConfig(std::initializer_list<int> devices, int64_t resources = BINARY_FLAT_DEFAULT_MEM);

功能描述

“devices”使用initializer_list的构造函数。

输入

std::initializer_list<int> devices:Device侧设备ID,对于该类,仅支持单Device,即“devices”长度为“1”

int64_t resources:预置的内存池大小,默认值为1024MB。

输出

返回值

约束说明

  • “devices”需要为合法有效不重复的设备ID,长度为1。
  • “resources”合法范围为[1024*1024*1024, 32*1024*1024*1024],10million底库推荐申请5GB。

API定义

AscendIndexBinaryFlatConfig(std::vector<int> devices, int64_t resources = BINARY_FLAT_DEFAULT_MEM);

功能描述

“devices”使用vector的构造函数。

输入

std::vector<int> devices:Device侧设备ID,对于该类,仅支持单Device,即“devices”长度为“1”

int64_t resources:预置的内存池大小,默认值为1024MB。

输出

返回值

约束说明

  • “devices”需要为合法有效不重复的设备ID,长度为1。
  • “resources”合法范围为[1024*1024*1024, 32*1024*1024*1024],10million底库推荐申请5GB。