文生图场景

本章节将指导用户使用RAG SDK根据文本提示词生成图片。

前提条件

参见stable-diffusion运行说明，基于MindIE完成stable-diffusion服务的运行。
已经完成安装RAG SDK。

样例介绍

该样例通过RAG SDK发送提示词，通过Stable Diffusion大模型生成图片。

操作步骤

在任意目录编辑创建text2img_demo.py，内容如下：

import argparse
from mx_rag.chain import Text2ImgChain
from mx_rag.llm import Text2ImgMultiModel
from mx_rag.utils import ClientParam
if __name__ == '__main__':
    parser = argparse.ArgumentParser()
    parser.add_argument('--url', type=str)
    parser.add_argument('--prompt', type=str)
    parser.add_argument('--use_http', type=bool, default=False)
    parser.add_argument('--ca_file', type=str, default="/path/to/ca_file")
    args = parser.parse_args()
    client_param = ClientParam(ca_file=args.ca_file)
    text2img_chain = Text2ImgChain(
        multi_model=Text2ImgMultiModel(model_name="sd", url=args.url, client_param=client_param)
    )
    llm_data = text2img_chain.query("请根据文字生成图片", prompt=args.prompt, output_format="jpg")
    print(llm_data)

执行如下命令运行，其他参数按实际情况配置，参考ClientParam。

python3 text2img_demo.py --url {sd模型图片生成url} --prompt="dog wearing black glasses" --ca_file "/path/to/ca_file"

父主题： 应用开发