总体说明
样例介绍
本章节介绍基于Atlas 800I A2 推理服务器,使用RAG SDK Python接口开发基于知识库的问答系统。RAG SDK运行框架如图1所示,其运行步骤分为“构建知识库”和“检索问答”。
本样例是一个文生文场景,检索方法为距离检索“FLAT:L2”方法,其中框架图中每个步骤的“[xxx]”表示可选的方法类。推理大模型使用Llama3-8B-Chinese-Chat,embedding模型使用模型acge_text_embedding,reranker(可选)模型使用bge-reranker-large。
前提条件
父主题: FlatL2检索方式