昇腾社区首页
中文
注册

总体介绍

快慢卡的快卡和慢卡是相对概念,快卡是在集群中首先完成计算任务的卡,慢卡是在集群任务中较慢完成计算任务的卡。在集群中往往需要完成集合通信,若不同卡完成任务的时间不同,则容易造成快卡等待慢卡完成计算的情况,从而使整个集群的性能劣化。

快慢卡是一种现象,背后的原因多种多样。通用的定位思路是,使用定点精确分析法,比对快卡和慢卡在MindStudio Insight时间线(Timeline)页签上的差异,确认具体原因。

形成慢卡的常见原因包括负载不均衡、计算性能波动、Host侧下发性能波动、数据加载性能波动等原因。

本节主要内容如下: