参数列表
成员名称  | 
类型  | 
默认值  | 
描述  | 
|---|---|---|---|
transWeight  | 
bool  | 
true  | 
权重是否需要转置,默认为true。  | 
rank  | 
int  | 
0  | 
当前卡所属通信编号。  | 
rankSize  | 
int  | 
0  | 
通信的卡的数量。“backend”为“lcoc”时,取值为2的幂次。  | 
rankRoot  | 
int  | 
0  | 
主通信编号。  | 
hasResidual  | 
bool  | 
false  | 
是否叠加残差。配置为“false”时不叠加残差,为“true”时叠加残差。默认不叠加残差。  | 
backend  | 
std::string  | 
"hccl"  | 
通信后端指示。支持“hccl”,“lccl”,“lcoc”。  | 
hcclComm  | 
HcclComm  | 
nullptr  | 
HCCL通信域指针。 默认为空,加速库为用户创建;若用户想要自己管理通信域,则需要传入该通信域指针,加速库使用传入的通信域指针来执行通信算子。  | 
commMode  | 
CommMode  | 
COMM_MULTI_PROCESS  | 
通信模式,CommMode类型枚举值。hccl多线程只支持外部传入通信域方式。不影响lcoc算子,设为默认值即可。  | 
rankTableFile  | 
std::string  | 
-  | 
集群信息的配置文件路径,适用单机以及多机通信场景,当前仅支持hccl后端场景。 ranktable配置请参考《TensorFlow 1.15模型迁移指南》的“模型训练>执行分布式训练>准备ranktable资源配置文件”章节。  | 
type  | 
ParallelType  | 
LINEAR_ALL_REDUCE  | 
权重并行类型。仅在“backend”为“lcoc”时生效。 
  | 
keepIntermediate  | 
bool  | 
false  | 
是否返回中间结果,仅在“ParallelType”使用“ALL_GATHER_LINEAR”时生效,其他场景需设置为false。  | 
quantType  | 
QuantType  | 
QUANT_TYPE_UNQUANT  | 
量化类型。仅在“backend”为“lcoc”时生效。 
  | 
quantGroupSize  | 
int32_t  | 
0  | 
量化类型为“QUANT_TYPE_PER_GROUP”时有效。  | 
outDataType  | 
aclDataType  | 
ACL_DT_UNDEFINED  | 
  | 
commDomain  | 
std::string  | 
-  | 
通信device组用通信域名标识,多通信域时使用。当backend为lccl时,commMode为多进程时,commDomain需要设置0-65535,支持设置通信域的内存大小,用于性能优化,配置方式通信域:通信域大小(MB),如“0:400”,当同一个通信域中多个算子配置冲突时,以第一个执行到的该通信域算子配置为准。 限制:默认值为200,当前配置大小不支持小于200。  | 
twoDimTPInfo  | 
TwoDimTPInfo  | 
-  | 
AllGather_Matmul_ReduceScatter算子参数。  | 
moeInfo  | 
MoeInfo  | 
1  | 
Moe场景参数,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。  | 
rsv[52]  | 
uint8_t  | 
{0}  | 
预留参数。  | 
成员名称  | 
类型  | 
默认值  | 
描述  | 
|---|---|---|---|
agDim  | 
uint16_t  | 
0  | 
表示allGather轴卡数,规定x轴方向是非连续卡号。  | 
rsDim  | 
uint16_t  | 
0  | 
表示reduceScatter轴卡数,规定y轴方向是连续卡号。  | 
innerDimIsAg  | 
uint8_t  | 
1  | 
allGather通信的rank是否连续,1表示true,0表示false。  | 
rsv[3]  | 
uint8_t  | 
{0}  | 
填充满8字节。  | 
成员名称  | 
类型  | 
默认值  | 
描述  | 
|---|---|---|---|
localExpertNums  | 
int16_t  | 
1  | 
当前卡处理的expert数量,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。  | 
epSize  | 
int8_t  | 
1  | 
EP域大小,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效。 需满足epSize*tpSize=rankSize。  | 
tpSize  | 
int8_t  | 
1  | 
TP域大小,仅当type为ALLTOALLVC_ALL_GATHER_GMM或 GMM_REDUCE_SCATTER_ALLTOALLVC时生效且只能为1。  |