def generate_stream(self, model_name, prompt, model_version, request_id, parameters)
函数功能
实现流式文本生成。
函数原型
1 | def generate_stream(self, model_name, prompt, model_version, request_id, parameters): |
参数说明
参数名 |
参数类型 |
输入/输出 |
说明 |
|---|---|---|---|
model_name |
str |
输入 |
模型名称。 模型名称支持大小写字母、数字、点号、中划线和下划线中一种或任意几种字符组成,最大长度为1000。 |
prompt |
str |
输入 |
模型输入字符串,长度取值范围为[1, 512000]。 |
model_version |
str |
输入 |
模型版本,默认为""。该字段暂不支持,不传递。 |
request_id |
str |
输入 |
请求ID,默认为"";如果request_id为空,则会随机初始化一个值。如果为非空,长度需满足[1,1000]。 |
parameters |
dict |
输入 |
额外的请求参数,默认为None;包括seed、temperature、top_k、top_p、do_sample、repetition_penalty、typical_p、batch_size、details和max_new_tokens,详情请参见表1。 |
当参数不满足限制条件或者response返回状态码不等于200时会抛异常。
返回值
每次推理返回当前生成的文本。