本章节简单介绍如何使用Splitfuse功能。
cd ${mindie-service安装路径} vi conf/config.json
SplitFuse特性必须额外配置的参数如下:
"plugin_params": "{\"plugin_type\":\"splitfuse\"}"
"templateType": "Mix",
"policyType": 0,
"enableSplit": true, "splitType": false, "splitStartType": false, "splitChunkTokens": 512, "splitStartBatchSize": 16
保存修改后的配置并启动服务化:
./bin/mindieservice_daemon
benchmark \ --DatasetPath "/{数据集路径}/GSM8K" \ --DatasetType "gsm8k" \ --ModelName "baichuan2_13b" \ --ModelPath "/{模型路径}/baichuan2-13b" \ --TestType client \ --Http https://{ipAddress}:{port} \ --ManagementHttp https://{managementIpAddress}:{managementPort} \ --MaxOutputLen 512
Benchmark输出结果如下所示: