昇腾社区首页
中文
注册

add_file

功能描述

将单个文档添加到知识库中,对文件切分后的信息进行embedding,保存至向量数据库,文档切片保存在文档数据库,并将文档记录保存在知识库数据库中,仅知识库管理员有权限操作。

函数原型

def add_file(file, texts, embed_func, metadatas)

参数说明

参数名

数据类型

可选/必选

说明

file

pathlib.Path

必选

上传文档的pathlib.Path对象,其中文件路径长度取值范围为[1, 1024],不能为软链接且不允许存在"..",文件名长度不能超过200。

texts

List[str]

必选

文档切片后的列表,需要和metadatas的数量保持一致,列表长度取值范围为[1, 1000 * 1000],字符串长度取值范围为[1, 128 * 1024 * 1024]。

embed_func

dict

必选

嵌入函数,将文本或图片转换为向量。

只允许{'dense': x, 'sparse': y}形式,x和y分别为稠密和稀疏向量的回调函数,xy不能同时为None。

metadatas

List[dict]

可选

文档切片的metadata,默认值为“None”,列表中元素字典的字符串长度不能超过1024,字典长度不能超过1024,字典嵌套不能超过1层。需要和texts的数量保持一致,列表长度取值范围为[1, 1000 * 1000]。