昇腾社区首页
中文
注册

类功能

功能描述

继承实现langchain_community.document_loaders.base.BaseLoader,执行Excel表格解析功能,支持.xlsx,.xls格式的文件。当前只支持纯文本内容解析,暂时不支持图片与合并格式识别。

函数原型

from mx_rag.document.loader import ExcelLoader
ExcelLoader(file_path,  line_sep="**;")

参数说明

参数名

类型

可选/必选

说明

file_path

str

必选

Excel文件路径,路径长度取值范围为[1,1024],不能为软链接且不允许存在".."。单文件表单数量≤1000,文档大小≤100MB。(.xlsx格式解压后文档大小不能超过500MB)。

line_sep

str

可选

可自定义的行间分隔符,默认值“**;”,长度取值范围为[1,1024]。

调用示例

from mx_rag.document.loader import ExcelLoader
loader = ExcelLoader("test.xlsx")
docs = loader.lazy_load()
print(list(docs))