配套工具
MindIE中有配套的MindIE Benchmark工具,用来在TGI线上部署前计算推理性能和精度,调用方式如下:
- 启动Server服务,具体见环境准备。
- 使用MindIE Benchmark计算性能和精度,参数说明请参见表1。
# 环境变量设置 source /usr/local/Ascend/mindie/set_env.sh #启动Benchmark benchmark --DatasetPath "/path/to/dataset/CEval" --DatasetType "ceval" --ModelName "llama3_70b" -ModelPath "/path/to/weights/llama3-70b" --TestType tgi_client --Concurrency 1 --Tokenizer True --Http http://127.0.0.1:12347 --TestAccuracy True --MaxOutputLen 1
表1 参数说明 参数名
参数解释
DatasetPath
数据集路径。
DatasetType
数据集名称。
ModelName
模型名。
ModelPath
模型权重路径。
TestType
指定MindIE Benchmark运行模式为TGI服务框架。
Concurrency
并发数。
Tokenizer
使用分词器。
Http
用户设置的推理服务侦听IP和Port。
TestAccuracy
“True”为精度测试,“False”为性能测试。
MaxOutputLen
指定输出长度。
在使用MindIE Benchmark进行性能测试时,需将“DatasetPath”和“DatasetType”换成对应性能数据集,并将“TestAccuracy”设为“False”。
- 精度计算结果如下图所示。
父主题: TGI