昇腾社区首页
中文
注册

BaseLoader类

类功能

文档加载Loader基类。针对.xlsx、.docx、.pptx等文件,进行ZIP bomb文件校验,校验标准为:解压后的文件大小不超过500MB,解压后的文件个数不大于5120个,同时需确保解压后的磁盘空间大于200MB。

加载文本文件时,待解析的文档需UTF-8格式编码,否则可能解析失败。

函数原型

from mx_rag.document.loader import BaseLoader
BaseLoader(file_path)

参数说明

参数名

类型

可选/必选

说明

file_path

str

必选

文档路径,路径长度取值范围为[1,1024],不能为软链接且不允许存在"..",文档不大于100MB。