build_graph
功能
调用此函数创建文本节点索引以及生成对应文本的知识图谱。
函数原型
def build_graph(lang, pad_token, conceptualize, **kwargs)
输入参数说明
参数名 |
数据类型 |
是否必选 |
说明 |
|---|---|---|---|
lang |
Lang |
否 |
语料所用的语言,默认取值为Lang.EN,即英文语料。 |
pad_token |
str |
否 |
大语言模型使用填充字符,默认为空字符,其取值范围为[0, 255]。 |
conceptualize |
bool |
否 |
是否进行对节点概念化,默认为False。 |
kwargs |
dict |
否 |
扩展参数列表:
|
返回值说明
无
方法执行后会在work_dir下生成过程文件:
文件名 |
说明 |
|---|---|
"{graph_name}.json" |
用于保存图,graph_type为"networkx"时,检索会通过该文件加载图。 |
"{graph_name}_relations.json" |
保存实体关系信息。 |
"{graph_name}_concepts.json" |
保存概念信息。 |
"{graph_name}_synset.json" |
保存概念聚类之后的类别信息。 |
"{graph_name}_node_vectors.index" |
实体的向量索引文件。 |
"{graph_name}_concept_vectors.index" |
概念的向量索引文件。 |
父主题: GraphRAGPipeline