昇腾社区首页
中文
注册

类功能

功能描述

该类实现了对文档提取总结内容。

函数原型

from mx_rag.summary import Summary
Summary(llm, llm_config)

参数说明

参数名

数据类型

可选/必选

说明

llm

Text2TextLLM

必选

大模型对象实例,具体类型请参考Text2TextLLM类

llm_config

LLMParameterConfig

可选

调用大模型参数,此处默认值temperature为“0.5”,top_p为“0.95”,其余参数说明请参见LLMParameterConfig类

调用示例

from langchain_text_splitters import RecursiveCharacterTextSplitter
from mx_rag.document.loader import DocxLoader
from mx_rag.llm import Text2TextLLM
from mx_rag.summary import Summary
from mx_rag.utils import ClientParam
client_param = ClientParam(ca_file="/path/to/ca.crt")
llm = Text2TextLLM(base_url="https://ip:port/v1/chat/completions", model_name="qianwen-7b", client_param=client_param)
loader=DocxLoader("/home/HwHiAiUser/MindIE.docx")
docs = loader.load_and_split(RecursiveCharacterTextSplitter(chunk_size=750, chunk_overlap=150))
summary = Summary(llm=llm)
# 调用summarize方法
sub_summaries = summary.summarize([doc.page_content for doc in docs])
# 调用merge_text_summarize方法
res = summary.merge_text_summarize(sub_summaries)
print(res)