规格约束
HCCL性能测试工具会按照用户配置的单个计算节点参与训练的NPU个数来拉起Device,假设单个计算节点上参与训练的NPU个数为x(即-p后的参数取值为x),则会从Device ID为0的设备开始,连续拉起x个Device。
- 针对
Atlas A3 训练系列产品 /Atlas A3 推理系列产品 :“-p”支持配置为1~16,拉起的Device ID为:[0, p-1]。 - 针对
Atlas A2 训练系列产品 :“-p”支持配置为1~8,拉起的Device ID为:[0, p-1] - 针对
Atlas 训练系列产品 :“-p”支持配置为1、2、4、8,拉起的Device ID为:[0, p-1]。 - 针对Atlas 300I Duo 推理卡,不同的测试命令支持的最大“-p”值不同:
- all_gather_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
- all_gatherv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
- all_reduce_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
- alltoall_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
- alltoallv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。
- reduce_scatter_test:“-p”最大支持配置为32,拉起的Device ID为:[0, p-1]。
- reduce_scatterv_test:“-p”最大支持配置为4,拉起的Device ID为:[0, p-1]。