add_file
功能描述
将单个文档添加到知识库中,对文件切分后的信息进行embedding,保存至向量数据库,文档切片保存在文档数据库,并将文档记录保存在知识库数据库中,仅知识库管理员有权限操作。
函数原型
def add_file(file, texts, embed_func, metadatas)
参数说明
参数名 |
数据类型 |
可选/必选 |
说明 |
---|---|---|---|
file |
pathlib.Path |
必选 |
上传文档的pathlib.Path对象,其中文件路径长度取值范围为[1, 1024],不能为软链接且不允许存在"..",文件名长度不能超过200。 |
texts |
List[str] |
必选 |
文档切片后的列表,需要和metadatas的数量保持一致,列表长度取值范围为[1, 1000 * 1000],字符串长度取值范围为[1, 128 * 1024 * 1024]。 |
embed_func |
dict |
必选 |
嵌入函数,将文本或图片转换为向量。 只允许{'dense': x, 'sparse': y}形式,x和y分别为稠密和稀疏向量的回调函数,xy不能同时为None。 |
metadatas |
List[dict] |
可选 |
文档切片的metadata,默认值为“None”,列表中元素字典的字符串长度不能超过1024,字典长度不能超过1024,字典嵌套不能超过1层。需要和texts的数量保持一致,列表长度取值范围为[1, 1000 * 1000]。 |
父主题: KnowledgeDB类