昇腾社区首页
中文
注册

规格约束

HCCL性能测试工具会按照用户配置的单个计算节点参与训练的NPU个数来拉起Device,假设单个计算节点上参与训练的NPU个数为x(即-p后的参数取值为x),则会从Device ID为0的设备开始,连续拉起x个Device。

  • 针对Atlas A3 训练系列产品/Atlas A3 推理系列产品:“-p”支持配置为1~16,拉起的Device ID为:[0, p-1]。
  • 针对Atlas A2 训练系列产品:“-p”支持配置为1~8,拉起的Device ID为:[0, p-1]
  • 针对Atlas 训练系列产品:“-p”支持配置为1、2、4、8,拉起的Device ID为:[0, p-1]。
  • 针对Atlas 300I Duo 推理卡,不同的测试命令支持的最大“-p”值不同:
    • all_gather_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
    • all_gatherv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
    • all_reduce_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
    • alltoall_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
    • alltoallv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
    • reduce_scatter_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
    • reduce_scatterv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。