开箱 启动客户模型时,具体使用TensorFlow技术栈或是PyTorch技术栈通常取决于客户的需求,开箱软件栈的选择应基于客户的推理框架流程。 使用TensorFlow框架,客户通常会提供一个pb文件,可以根据客户的软件栈运行模型,可参考社区上的demo(TF推理样例参考)。使用PyTorch路线,可以使用TorchAir套件进行推理,参考社区上的demo(TorchAir推理样例)。使用生态路线,即使用Inductor+Triton这套流程。完成开箱后,可以初步观察到性能基线,并与目标进行对比,同时参考本文前述章节中的profiling采集方法进行后续分析。 父主题: 性能优化分析