lazy_load
功能描述
实现langchain基类的lazy_load方法,加载并解析Markdown文件。
- 文档必须是Markdown格式,如果不是Markdown格式则会解析失败,抛出异常。
- 文档路径必须合法且必须存在,且文档大小≤100MB,否则会解析失败,抛出异常。
- 如果Markdown文档中存在图片,且vlm参数存在,则会调用vlm模型生成图片总结(仅支持本地图片)。
- 如果Markdown文档中存在表格,会按行改写为KV键值对的形式,以第一行表头的值作为键,以其他行的值作为值,键值之间以':'作为分隔符,列之间以','作为分隔符,行之间以';'作为分隔符,最后以'。'收尾。
函数原型
def lazy_load()
返回值说明
数据类型 |
说明 |
|---|---|
Iterator[Document] |
返回langchain中Document对象迭代器。 |
父主题: MarkdownLoader