本章节简单介绍如何使用Buffer Response功能。
cd {MindIE安装目录}/latest/mindie-service/ vi conf/config.json
"bufferResponseEnabled" : true, "prefillExpectedTime" : 1000, "decodeExpectedTime" : 50
./bin/mindieservice_daemon
benchmark \ --DatasetPath "数据集路径" \ --DatasetType "gsm8k" \ --ModelName $model_name \ --ModelPath $model_path \ --TestType client \ --Http https://{ipAddress}:{port} \ --ManagementHttp https://{managementIpAddress}:{managementPort} \ --Concurrency 1000 \ --RequestRate $1 \ --MaxOutputLen 输出长度 \ --Tokenizer True