华为计算微信公众号
昇腾AI开发者公众号
华为计算微博
华为计算今日头条
TGI并发请求返回结果异常
2024/02/21
603
问题信息
llama-13b部署TGI推理框架后,跑8个串行请求时返回结果正常,跑8个并行请求时返回结果异常。
config文件中的model_type取值为xverse,开发时适配内容没写这种type。
将config文件中的model_type取值改为llama。
本页内容