昇腾社区首页
中文
注册

文生图场景

本章节将指导用户使用RAG SDK根据文本提示词生成图片。

前提条件

样例介绍

该样例通过RAG SDK发送提示词,通过Stable Diffusion大模型生成图片。

操作步骤

  1. 在任意目录编辑创建text2img_demo.py,内容如下:
    import argparse
    from mx_rag.chain import Text2ImgChain
    from mx_rag.llm import Text2ImgMultiModel
    from mx_rag.utils import ClientParam
    if __name__ == '__main__':
        parser = argparse.ArgumentParser()
        parser.add_argument('--url', type=str)
        parser.add_argument('--prompt', type=str)
        parser.add_argument('--use_http', type=bool, default=False)
        parser.add_argument('--ca_file', type=str, default="/path/to/ca_file")
        args = parser.parse_args()
        client_param = ClientParam(ca_file=args.ca_file)
        text2img_chain = Text2ImgChain(
            multi_model=Text2ImgMultiModel(model_name="sd", url=args.url, client_param=client_param)
        )
        llm_data = text2img_chain.query("请根据文字生成图片", prompt=args.prompt, output_format="jpg")
        print(llm_data)
    
  2. 执行如下命令运行,其他参数按实际情况配置,参考ClientParam
    python3 text2img_demo.py --url {sd模型图片生成url} --prompt="dog wearing black glasses" --ca_file "/path/to/ca_file"