昇腾社区首页
中文
注册

embed_documents

功能描述

将文本列表进行向量化。

函数原型

def embed_documents(texts)

输入参数说明

参数名

数据类型

可选/必选

说明

texts

List[str]

必选

文本列表,列表长度取值[1, 1000*1000],列表中每个文本长度取值[1, 256]。

返回值说明

数据类型

说明

List[List[float]]

texts转换后的向量数组。

如果texts为长度是4的数组,embedding模型的输出是512维向量,最终的输出结果为(4,512)大小的数组