昇腾社区首页
中文
注册

summarize

功能描述

对文档通过大模型提取总结内容。

函数原型

def summarize(texts, not_summarize_threshold, prompt)

参数说明

参数名

数据类型

可选/必选

说明

texts

List[str]

必选

输入的文本列表,列表中的所有文本长度和的取值范围:(0, 1024*1024],列表长度取值范围:(0,1024]。

not_summarize_threshold

int

可选

单次总结时由于给定的文本太短,大模型无法进行总结或总结错误,此值设定需要大模型进行总结的文本长度阈值,如果给定的文本内容小于等于not_summarize_threshold,不调用大模型进行总结操作,总结内容为文本原始内容,默认值为“30”,取值范围(0, 1024*1024]。

prompt

langchain_core.prompts.PromptTemplate

可选

默认值如下,prompt中input_variables必须等于["text"],表示输入的文本,template长度取值范围(0,1024 * 1024]。实际请求大模型的query为prompt拼接text,其有效取值依赖MindIE的配置,请参见《MindIE Motor开发指南》中的“MindIE Motor组件 > MindIE Server > 配置参数说明”章节中关于“maxSeqLen”的说明。注意:prompt和text的语言类型最好保持一致或者指明大模型返回语言类型,否则会影响大模型回答效果。

_SUMMARY_TEMPLATE = PromptTemplate(

input_variables=["text"],

template="""使用简洁的语言提取以下内容的摘要,包含尽可能多的关键信息,输出只包含内容信息,请用中文回答\n\n{text}"""),

返回值说明

数据类型

说明

List[str]

对应总结后的文本列表