昇腾社区首页
中文
注册

方案介绍

Volcano可实现以下2个方面的亲和性调度:基于昇腾AI处理器的亲和性、基于节点的亲和性。

基本概念

  • 基于昇腾AI处理器的亲和性
    • 基于昇腾AI处理器的亲和性规则:基于昇腾AI处理器的互联拓扑结构和处理逻辑,实现芯片最佳利用。
    • 亲和性调度策略:基于昇腾AI处理器的亲和性规则,实现Volcano调度器用来选取特定昇腾AI处理器的调度逻辑。基于亲和性调度策略和调度原则,可以实现资源最优分配。
  • 基于节点的亲和性
    • 交换机亲和性调度:基于交换机下节点的组网配置和参数面网络配置,实现节点的最佳利用。
    • 逻辑超节点亲和性调度:对集群设备中的物理超节点根据切分策略划分出逻辑超节点,实现节点的最佳利用。

基于昇腾AI处理器的亲和性

本文档详细介绍了Atlas 训练系列产品Atlas 200T A2 Box16 异构子框A200T A3 Box8 超节点服务器Atlas 900 A3 SuperPoD 超节点昇腾AI处理器亲和性规则,在此基础上研发的Volcano组件调度规则方案。

基于节点的亲和性

本文档同时介绍了基于Atlas 训练系列产品Atlas A2 训练系列产品Atlas 900 A3 SuperPoD 超节点的亲和性规则,即交换机的节点调度规则;对Spine+Leaf网络架构模式下,选择调用哪个交换机下的节点进行了详细介绍。