昇腾社区首页
中文
注册

embed_documents

功能描述

使用模型将用户提供的文本转换至向量。

函数原型

def embed_documents(texts, batch_size)

输入参数说明

参数名

数据类型

可选/必选

说明

texts

List[str]

必选

文本列表,列表长度取值[1,1000*1000],字符串长度范围[1, 128 * 1024 * 1024]。

batch_size

int

可选

组batch的大小,每次会组合batch_size的texts进行embed操作,取值范围:[1, 1024],默认值为“32”

返回值说明

数据类型

说明

List[List[float]]

texts转换后的向量数组。

如果texts为长度是4的数组,embedding模型的输出是1024维向量,最终的输出结果为(4,1024)大小的数组。