下载
中文
注册
使用MindIE Benchmark或者脚本发送请求时出现超时提醒

使用MindIE Benchmark或者脚本发送请求时出现超时提醒

2025/03/24

247

暂无评分
我要评分

问题信息

问题来源产品大类关键字
官方模型推理MindIE Benchmark、发送请求、超时

问题现象描述

使用MindIE Benchmark或者脚本对MindIE Server发送请求时,部分请求出现超时且无返回的情况。

放大

原因分析

发送请求速率超过服务化所能处理请求的能力,请求积压导致返回超时。

解决措施

  • 使用MindIE BenchmarkMindIE Server发送请求时

    降低并发数,即降低MindIE Benchmark输入参数--Concurrency的值,其理论值为:npuBlockNum*cacheBlockSize/(平均输入长度+平均输出长度)。

  • 使用脚本对MindIE Server发送请求时

    可提升脚本中设置超时的时间限制。

本页内容