MindStudio Insight分析定位
MindStudio Insight加载全部数据,进行问题定位。
- 概览界面分析:该通信域内各卡的通信时间占比也较高,总体计算时间(纯计算时间+通信重叠时间)只占了总耗时的1/3,可以定界为通信问题。图1 概览界面
- 切换通信界面:发现存在大量卡间不同步现象(框中红色部分),这说明很多算子在长时间的等待,挑选了一张最明显的慢卡(第12卡)分析详细原因。图2 通信界面
- 切换时间线界面:明显看出12卡存在大段的Free(空闲时间),同时,AscendCL侧有大量的事件在占用资源。根据经验,这很可能是由于该卡内存占用过高,新申请数据时需要内存重整,从而导致存在较长空闲时间。我们可以使用export PYTORCH_NPU_ALLOC_CONF=“expandable_segments:True”解决内存碎片问题,提高内存利用率。在完成调试后解决该性能问题。图3 时间线界面图4 时间线界面
父主题: 性能调优案例