set_split_strategy_by_size

函数原型

def set_split_strategy_by_size(dataSizeList, group="hccl_world_group")

功能说明

基于梯度数据量百分比,在集合通信group内设置反向梯度切分策略,实现allreduce的融合,用于进行集合通信的性能调优。

参数说明

参数名

输入/输出

描述

dataSizeList

输入

list类型。

梯度参数数据量百分比列表。

  • 梯度的索引id列表需为非负,且梯度数据量序列总百分比之和必须为100。
  • 梯度的切分最多支持8段。
  • 比如模型总共有150M梯度数据量,需要切分90M,30M,30M三段,则可以设置dataSizeList =[60,20,20]。

group

输入

String类型,最大长度为128字节,含结束符。

group名称,可以为"hccl_world_group"或自定义group,默认为"hccl_world_group"。

返回值

无。

调用示例

from npu_bridge.npu_init import *
set_split_strategy_by_size([60, 20, 20], “group”)

约束说明