search_with_threshold
功能描述
在数据库中检索与传入的向量相似的向量,并根据阈值进行过滤。
函数原型
def search_with_threshold(embeddings, k, threshold, filter_dict)
参数说明
参数名 |
数据类型 |
是否必选 |
说明 |
---|---|---|---|
embeddings |
Union[ndarray, List[Dict[int, float]]] |
必选 |
稠密向量或稀疏向量,如果为前者则其类型为ndarray,如果是后者则其类型为List[Dict[int, float]]。 |
k |
int |
可选 |
返回的相似向量的个数,默认为“3”。 |
threshold |
float |
可选 |
分数阈值,默认为“0.1”。 |
filter_dict |
Dict |
可选 |
由检索条件组成的字典,当前只支持对document_id进行过滤,过滤的文档id以列表形式传入,例如,需要在document_id为1,2,4这几篇文档中过滤,则传入的字典为{"document_id": [1, 2, 4]}。 |
返回值说明
数据类型 |
说明 |
---|---|
List[List[float]], List[List[int]] |
检索到的最相似的k个向量的得分和ID。 |
父主题: VectorStore