类功能
功能描述
继承实现langchain_community.document_loaders.base.BaseLoader,执行Excel表格解析功能,支持.xlsx,.xls格式的文件。当前只支持纯文本内容解析,暂时不支持图片与合并格式识别。
函数原型
from mx_rag.document.loader import ExcelLoader ExcelLoader(file_path, line_sep="**;")
参数说明
参数名 |
类型 |
可选/必选 |
说明 |
---|---|---|---|
file_path |
str |
必选 |
Excel文件路径,路径长度取值范围为[1,1024],不能为软链接且不允许存在".."。单文件表单数量≤1000,文档大小≤100MB。(.xlsx格式解压后文档大小不能超过500MB)。 |
line_sep |
str |
可选 |
可自定义的行间分隔符,默认值“**;”,长度取值范围为[1,1024]。 |
调用示例
from mx_rag.document.loader import ExcelLoader loader = ExcelLoader("test.xlsx") docs = loader.lazy_load() print(list(docs))
父主题: ExcelLoader类