简介
MindStudio推理工具链为开发者提供一站式推理开发工具,致力于加速模型问题定位效率,提升模型推理性能。
本文档以Llama-3.1-8B-Instruct模型为例,介绍针对大模型推理工具链中的模型压缩、推理数据dump、自动精度比对、性能调优等工具的应用。
父主题: 大模型推理工具快速入门
MindStudio推理工具链为开发者提供一站式推理开发工具,致力于加速模型问题定位效率,提升模型推理性能。
本文档以Llama-3.1-8B-Instruct模型为例,介绍针对大模型推理工具链中的模型压缩、推理数据dump、自动精度比对、性能调优等工具的应用。