常见性能问题场景 大模型从其他设备迁移至昇腾设备,并在昇腾设备上训练的过程中,可能会出现性能问题。性能问题主要体现在开箱性能不足和长期运行后的性能衰退两个方面。 开箱性能优化:用户在昇腾平台使用模型时,发现性能差,直接进行性能层面的优化。性能长跑劣化:用户在训练过程中,由于不可预知的引入,导致模型出现了一些性能劣化的问题,需要定位性能劣化的原因并解决。 图1 场景介绍