昇腾社区首页
中文
注册

query

功能描述

从给定的文本提示生成图片。

函数原型

def query(text, llm_config, *args, **kwargs)

参数说明

参数名

数据类型

可选/必选

说明

text

str

必选

图片生成提示词,非空,最大长度为1024*1024。

llm_config

LLMParameterConfig

可选

调用大模型的参数,具体说明可参见LLMParameterConfig类

args

list

可选

继承自基类,未使用。

kwargs["output_format"]

str

可选

输出的图片格式,通过kwargs["output_format"]获取,支持

["png", "jpeg", "jpg", "webp"],默认取值为“png”

kwargs["size"]

str

可选

图片生成尺寸,表示为"height*width",由入参kwargs传递,具体支持的尺寸由对应的大模型决定,正则匹配格式为"^\d{1,5}\*\d{1,5}$",默认为“512*512”

返回值说明

数据类型

说明

Dict,

{"prompt": prompt, "result": data}

其中data为图片base64编码后的数据。

调用示例

from mx_rag.chain import Text2ImgChain
from mx_rag.llm import Text2ImgMultiModel
from mx_rag.utils import ClientParam
client_param = ClientParam(ca_file="/path/to/ca.crt")
multi_model=Text2ImgMultiModel(model_name="sd", url="text to img url", client_param=client_param)
text2img_chain = Text2ImgChain(multi_model=multi_model)
llm_data = text2img_chain.query("dog wearing black glasses", output_format="jpg")
print(llm_data)