BaseLoader类
类功能
文档加载Loader基类。针对.xlsx、.docx、.pptx等文件,进行ZIP bomb文件校验,校验标准为:解压后的文件大小不超过500MB,解压后的文件个数不大于5120个,同时需确保解压后的磁盘空间大于200MB。
加载文本文件时,待解析的文档需UTF-8格式编码,否则可能解析失败。
函数原型
from mx_rag.document.loader import BaseLoader BaseLoader(file_path)
参数说明
参数名 |
类型 |
可选/必选 |
说明 |
---|---|---|---|
file_path |
str |
必选 |
文档路径,路径长度取值范围为[1,1024],不能为软链接且不允许存在"..",文档不大于100MB。 |
父主题: 文档解析