本特性特别适用于以下场景:
需要处理大量多模态数据(如文本、图像、音频)的大型神经网络训练任务,并且流水线并行各个阶段传递多参数。
--pipeline-model-parallel-size N # 开启流水线并行, N大于等于2 --use-multiparameter-pipeline-model-parallel
--pipeline-model-parallel-size N # 开启流水线并行, N大于等于2 --num-layers-per-virtual-pipeline-stage N # N不为None --use-multiparameter-pipeline-model-parallel
用户需配置args.pipeline_tensor_shapes,明确指定各阶段间传递的具体参数及其属性(如shape、dtype)。args.pipeline_tensor_shapes配置可参考“tests_extend/system_tests/multi_modal/multi_parameter_pipeline/pretrain_multi_parameter_pipeline_test.py”设置训练脚本参数。
采用PP支持多参数传递后,用户可以在保持高通信效率的同时,更灵活地处理复杂的多模态数据。