参数列表
成员名称 |
类型 |
默认值 |
描述 |
---|---|---|---|
transWeight |
bool |
true |
权重是否需要转置,默认为true。 |
rank |
int |
0 |
当前卡所属通信编号。 |
rankSize |
int |
0 |
通信的卡的数量。“backend”为“lcoc”时,取值为2的幂次。 |
rankRoot |
int |
0 |
主通信编号。 |
hasResidual |
bool |
false |
是否叠加残差。配置为“false”时不叠加残差,为“true”时叠加残差。默认不叠加残差。 |
backend |
std::string |
"hccl" |
通信后端指示。支持“hccl”,“lccl”,“lcoc”。 |
hcclComm |
HcclComm |
nullptr |
HCCL通信域指针。 默认为空,加速库为用户创建;若用户想要自己管理通信域,则需要传入该通信域指针,加速库使用传入的通信域指针来执行通信算子。 |
commMode |
CommMode |
COMM_MULTI_PROCESS |
通信模式,CommMode类型枚举值。hccl多线程只支持外部传入通信域方式。不影响lcoc算子,设为默认值即可。 |
rankTableFile |
std::string |
- |
集群信息的配置文件路径,适用单机以及多机通信场景,当前仅支持hccl后端场景。 ranktable配置请参考《TensorFlow 1.15模型迁移指南》的“模型训练>执行分布式训练>准备ranktable资源配置文件”章节。 |
type |
ParallelType |
LINEAR_ALL_REDUCE |
权重并行类型。仅在“backend”为“lcoc”时生效。
|
keepIntermediate |
bool |
false |
是否返回中间结果,仅在“ParallelType”使用“ALL_GATHER_LINEAR”时生效,其他场景需设置为false。 |
quantType |
QuantType |
QUANT_TYPE_UNQUANT |
量化类型。仅在“backend”为“lcoc”时生效。
|
quantGroupSize |
int32_t |
0 |
量化类型为“QUANT_TYPE_PER_GROUP”时取值范围为2、4、8、16、32、64,其它量化类型取0。 |
outDataType |
aclDataType |
ACL_DT_UNDEFINED |
|
commDomain |
std::string |
- |
通信device组用通信域名标识,多通信域时使用。当backend为lccl时,commMode为多进程时,commDomain需要设置0-65535,支持设置通信域的内存大小,用于性能优化,配置方式通信域:通信域大小(MB),如“0:400”,当同一个通信域中多个算子配置冲突时,以第一个执行到的该通信域算子配置为准。 限制:默认值为200,当前配置大小不支持小于200。 |
twoDimTPInfo |
TwoDimTPInfo |
- |
AllGather_Matmul_ReduceScatter算子参数。 |
moeInfo |
MoeInfo |
1 |
Moe场景参数,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。 |
rsv[52] |
uint8_t |
{0} |
预留参数。 |
成员名称 |
类型 |
默认值 |
描述 |
---|---|---|---|
agDim |
uint16_t |
0 |
表示allGather轴卡数,规定x轴方向是非连续卡号。 |
rsDim |
uint16_t |
0 |
表示reduceScatter轴卡数,规定y轴方向是连续卡号。 |
innerDimIsAg |
uint8_t |
1 |
allGather通信的rank是否连续,1表示true,0表示false。 |
rsv[3] |
uint8_t |
{0} |
填充满8字节。 |
成员名称 |
类型 |
默认值 |
描述 |
---|---|---|---|
localExpertNums |
int16_t |
1 |
当前卡处理的expert数量,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。 |
epSize |
int8_t |
1 |
EP域大小,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。 需满足epSize*tpSize=rankSize。 |
tpSize |
int8_t |
1 |
TP域大小,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效且只能为1。 |