昇腾社区首页
中文
注册

功能介绍

昇腾原生IVFSP检索算法,使用自研矩阵近似策略,压缩特征向量后存底库,并使用自研倒排链策略选取出最可能包含Ground Truth(真实)的底库,最后使用自研检索策略在倒排链过滤后的底库进行检索得到Top K向量结果。

AscendIndexIVFSP只支持标准态场景,且只支持Atlas 推理系列产品

支持多线程并发调用,需要设置“MX_INDEX_MULTITHREAD”环境变量为1,即export MX_INDEX_MULTITHREAD=1,设置为其他值或者不设置,则表示不开启多线程功能。当前的特征检索内部会使用OMP做性能加速,OMP不支持与其他多线程机制混用。反复创建新线程使用OMP会导致内存持续累加,因此建议使用固定的线程来运行检索任务。