若运行Vega的主机环境中有多张NPU,可通过设置如下配置项支持多NPU:
general:
parallel_search: True
parallel_fully_train: True
devices_per_trainer: 1
其中:
- parallel_search:控制是否在模型搜索阶段并行搜索多个模型,其中每个模型使用一个或多个NPU。
- parallel_fully_train: 控制是否在fully train阶段并行训练多个模型,其中每个模型使用一个或多个NPU。
- devices_per_trainer: 当如上任一控制项为True是生效,用于控制一个模型对应多少个NPU。