embed_documents
功能描述
调用TEI服务,将用户提供的文本列表转换至向量。
函数原型
def embed_documents(texts, batch_size)
输入参数说明
参数名 |
数据类型 |
可选/必选 |
说明 |
---|---|---|---|
texts |
List[str] |
必选 |
文本列表,列表长度取值(0,1000*1000],字符串长度范围:[1, 128 * 1024 * 1024]。 |
batch_size |
int |
可选 |
组batch的大小,每次会组合batch_size的texts进行embed操作,取值范围:[1, 1024],默认值为“32”。 |
返回值说明
数据类型 |
说明 |
---|---|
List[List[float]] |
texts转换后的向量数组。 如果texts为长度是4的数组,embedding模型的输出是1024维向量,最终的输出结果为(4,1024)大小的数组。 |
父主题: TEIEmbedding类