类功能
功能描述
该类实现了对文档提取总结内容。
函数原型
from mx_rag.summary import Summary Summary(llm, llm_config)
参数说明
参数名 |
数据类型 |
可选/必选 |
说明 |
---|---|---|---|
llm |
Text2TextLLM |
必选 |
大模型对象实例,具体类型请参考Text2TextLLM类。 |
llm_config |
LLMParameterConfig |
可选 |
调用大模型参数,此处默认值temperature为“0.5”,top_p为“0.95”,其余参数说明请参见LLMParameterConfig类。 |
调用示例
from langchain_text_splitters import RecursiveCharacterTextSplitter from mx_rag.document.loader import DocxLoader from mx_rag.llm import Text2TextLLM from mx_rag.summary import Summary from mx_rag.utils import ClientParam client_param = ClientParam(ca_file="/path/to/ca.crt") llm = Text2TextLLM(base_url="https://ip:port/v1/chat/completions", model_name="qianwen-7b", client_param=client_param) loader=DocxLoader("/home/HwHiAiUser/MindIE.docx") docs = loader.load_and_split(RecursiveCharacterTextSplitter(chunk_size=750, chunk_overlap=150)) summary = Summary(llm=llm) # 调用summarize方法 sub_summaries = summary.summarize([doc.page_content for doc in docs]) # 调用merge_text_summarize方法 res = summary.merge_text_summarize(sub_summaries) print(res)
父主题: Summary类