昇腾社区首页
中文
注册
开发者
下载

规格约束

HCCL性能测试工具会按照用户配置的单个计算节点参与训练的NPU个数来启动Device,假设单个计算节点上参与训练的NPU个数为x(即-p后的参数取值为x),则会从Device ID为0的设备开始,连续启动x个Device。

  • 针对Atlas A3 训练系列产品/Atlas A3 推理系列产品:“-p”支持配置为1~16,启动的Device ID为:[0, p-1]。
  • 针对Atlas A2 训练系列产品/Atlas A2 推理系列产品:“-p”支持配置为1~8,启动的Device ID为:[0, p-1]
  • 针对Atlas 训练系列产品:“-p”支持配置为1、2、4、8,启动的Device ID为:[0, p-1]。
  • 针对Atlas 推理系列产品,不同的测试命令支持的最大“-p”值不同:
    • all_gather_test:“-p”最大支持配置为32,启动的Device ID为:[0, p-1]。
    • all_gatherv_test:“-p”最大支持配置为4,启动的Device ID为:[0, p-1]。
    • all_reduce_test:“-p”最大支持配置为32,启动的Device ID为:[0, p-1]。
    • alltoall_test:“-p”最大支持配置为4,启动的Device ID为:[0, p-1]。
    • alltoallv_test:“-p”最大支持配置为4,启动的Device ID为:[0, p-1]。
    • reduce_scatter_test:“-p”最大支持配置为32,启动的Device ID为:[0, p-1]。
    • reduce_scatterv_test:“-p”最大支持配置为4,启动的Device ID为:[0, p-1]。