MindIE中有配套的MindIE Benchmark工具,用来计算推理性能和精度,调用方式如下:
#通过MindIE Benchmark发送请求 benchmark \ --DatasetPath "/path/to/dataset/CEval" \ --DatasetType "ceval" \ --ModelName "llama3_70b" \ --ModelPath "/path/to/weights/llama3-70b" \ --TestType vllm_client \ --Concurrency 1 \ --Tokenizer True \ --Http http://127.0.0.1:8111 \ --TestAccuracy True \ --MaxOutputLen 1
在使用MindIE Benchmark进行性能测试时,需将DatasetPath及DatasetType换成对应性能数据集,并将TestAccuracy设为False。
参数名 |
参数解释 |
---|---|
DatasetPath |
数据集路径。 |
DatasetType |
数据集名称。 |
ModelName |
模型名。 |
ModelPath |
模型权重路径。 |
TestType |
指定MindIE Benchmark运行模式为vLLM服务框架。 |
Concurrency |
并发数。 |
Tokenizer |
使用分词器。 |
Http |
用户设置的推理服务侦听IP和Port。 |
TestAccuracy |
“True”为精度测试,“False”为性能测试。 |
MaxOutputLen |
指定输出长度。 |
MindIE Benchmark详细使用方法以及参数的介绍详情请参见《MindIE Service开发指南》的“MindIE Service组件 > MindIE Service Tools > MindIE Benchmark > 功能介绍”章节。