tokenids推理样例
- 如果执行文本推理时报“cannot allocate memory in static TLS block”错误,处理方法请参见使用第三方库transformers跑模型推理时,报错“cannot allocate memory in static TLS block”章节。
- 执行样例前请使用以下命令配置环境变量。
source /usr/local/Ascend/ascend-toolkit/set_env.sh # CANN source /usr/local/Ascend/nnal/atb/set_env.sh # ATB source /usr/local/Ascend/atb-models/set_env.sh # ATB Models source /usr/local/Ascend/mindie/set_env.sh # MindIE
带后处理性能测试样例
# Engine模式 tokenids推理
SMPL_PARAM='{"temperature":0.5,"top_k":10,"top_p":0.9,"seed":1234,"repetition_penalty":1}'
benchmark \
--DatasetPath "/{数据集路径}/gsm8k/xx.csv" \
--DatasetType gsm8k \
--ModelName llama2-7b \
--ModelPath "/{模型权重路径}/llama2-7b/" \
--TestType engine \
--Tokenizer False \
--MaxOutputLen 512 \
--DoSampling True \
--SamplingParams=$SMPL_PARAM
不带后处理性能测试样例
# Engine模式 tokenids推理
benchmark \
--DatasetPath "/{数据集路径}/gsm8k/xx.csv" \
--DatasetType "gsm8k" \
--ModelName "baichuan2_13b" \
--ModelPath "/{模型权重路径}/baichuan2-13b" \
--TestType engine \
--Tokenizer False
父主题: Engine推理模式