昇腾社区首页
中文
注册

build_graph

功能

调用此函数创建文本节点索引以及生成对应文本的知识图谱。

函数原型

def build_graph(lang, pad_token, conceptualize, **kwargs)

输入参数说明

参数名

数据类型

是否必选

说明

lang

Lang

语料所用的语言,默认取值为Lang.EN,即英文语料。

pad_token

str

大语言模型使用填充字符,默认为空字符,其取值范围为[0, 255]。

conceptualize

bool

是否进行对节点概念化,默认为False。

kwargs

dict

扩展参数列表:

  • max_workers:构建知识图谱的线程数,默认为min(32, (cpu_count() or 1)+4),其取值范围为[1, 512]。
  • top_k:在对图节点的概念进行聚类时,向量检索返回的top个数,默认为5,其取值范围为[1, 100]。
  • threshold:向量相似性阈值,默认为0.3,低于此值将被过滤,其取值范围为[0.0,1.0]。

返回值说明