问题信息收集
在定位问题之前,务必收集准确的问题信息,具体请参考表1。
类别 |
主要信息 |
说明 |
---|---|---|
基本信息 |
模型类型 |
了解模型结构(类Llama、类GPT、是否是MoE等)。 |
作业规模 |
卡数、机器数。 |
|
并行策略 |
具体并行参数配置。 |
|
框架和版本 |
|
|
关键问题描述 |
问题场景 |
在模型训练或推理过程中,其表现未达到预期标准或竞品水平,或者出现了性能下降等异常情况。
|
当前性能指标 |
||
优化目标 |
性能优化的目标 |
明确优化目标及来源,例如是否基于竞品对比,还是通过线性度推算等。 |
父主题: 性能问题的定位流程