昇腾社区首页
中文
注册

search_with_threshold

功能描述

在数据库中检索与传入的向量相似的向量,并根据阈值进行过滤。

函数原型

def search_with_threshold(embeddings, k, threshold, filter_dict)

参数说明

参数名

数据类型

是否必选

说明

embeddings

Union[ndarray, List[Dict[int, float]]]

必选

稠密向量或稀疏向量,如果为前者则其类型为ndarray,如果是后者则其类型为List[Dict[int, float]]。

k

int

可选

返回的相似向量的个数,默认为“3”

threshold

float

可选

分数阈值,默认为“0.1”

filter_dict

Dict

可选

由检索条件组成的字典,当前只支持对document_id进行过滤,过滤的文档id以列表形式传入,例如,需要在document_id为1,2,4这几篇文档中过滤,则传入的字典为{"document_id": [1, 2, 4]}。

返回值说明

数据类型

说明

List[List[float]], List[List[int]]

检索到的最相似的k个向量的得分和ID。