昇腾社区首页
中文
注册

超大集群快慢卡定位思路

图1 超大集群快慢卡定位思路

1. 根据模型调优性能采集工具中描述,采集集群全量数据,设置Level=L1,关闭with_stack,schedule,设置activate为2,采集两个step的性能数据。

2. 使用模型调优快速分析(msprof-analyze命令行工具)中的msprof-analyze工具进行communication_matrix解析。

3. 从集群数据找出异常节点,获取正常和异常节点的性能数据。

4. 对第三点得到的性能数据采用快慢卡定点精确分析法中的方法进行分析,这样就把超大集群的问题简化为一般多机集群问题定位。