昇腾社区首页
中文
注册

AscendIndexInt8IVFFlat

API定义

AscendIndexInt8IVFFlat(int dims, int nlist, faiss::MetricType metric = MetricType::METRIC_L2, AscendIndexInt8IVFFlatConfig config = AscendIndexInt8IVFFlatConfig())

功能描述

AscendIndexInt8IVFFlat的构造函数,根据“config”中配置的值设置NPU侧资源。

输入

int dims:AscendIndexInt8IVFFlat管理的一组特征向量的维度。

int nlist:聚类中心的个数,与算子生成脚本中的“coarse_centroid_num”参数对应。

faiss::MetricType metric:AscendIndex在执行特征向量相似度检索的时候使用的距离度量类型。

AscendIndexInt8IVFFlatConfig config:NPU侧资源配置。

输出

返回值

约束说明

  • dim ∈ {64, 128, 256, 384, 512, 1024}
  • nlist ∈ {1024, 2048, 4096, 8192, 16384}
  • metric ∈ {faiss::MetricType::METRIC_L2,faiss::MetricType::METRIC_INNER_PRODUCT}