参数列表
成员名称  | 
描述  | 
|---|---|
RmsNormParam  | 
RMSNORM参数。 
  | 
PrecisionMode  | 
PRECISIONMODE参数。 
  | 
ModelType  | 
MODELTYPE参数。 
  | 
layerType  | 
归一化类型,参数如下: 
  | 
normParam  | 
NORM参数。具体请参见表1。  | 
preNormParam  | 
PRENORM参数。具体请参见表2。  | 
postNormParam  | 
POSTNORM参数。具体请参见表3。  | 
rsv[8]  | 
预留参数。  | 
参数  | 
类型  | 
默认值  | 
描述  | 
|---|---|---|---|
quantType  | 
QuantType  | 
QUANT_UNQUANT  | 
量化类型。 当前支持以下类型。 
  | 
epsilon  | 
float  | 
1e-5  | 
Epsilon,归一化时加在分母上防止除0。  | 
layerNormEps  | 
float  | 
1e-5  | 
Epsilon,默认为1e-5,暂时不使用。  | 
rstd  | 
bool  | 
false  | 
默认为False,设置为true时会使用训练的rmsnormforward算子。 仅 不支持和“precisionMode”,“modelType”同时设置。 量化场景下不支持使用“rstd”。  | 
precisionMode  | 
PrecisionMode  | 
HIGH_PRECISION_MODE  | 
默认为HIGH_PRECISION_MODE。 支持参数如下: 
 不支持和“rstd”,“modelType”同时设置。 输入类型只支持float16。 量化场景下不支持使用“precisionMode”,该场景下配置该参数将返回报错ERROR_INVALID_PARAM。  | 
modelType  | 
ModelType  | 
LLAMA_MODEL  | 
默认为LLAMA_MODEL,设置为GEMMA_MODEL时使用gemma模型的rmsnorm计算公式。 支持参数如下: 
 不支持和“rstd”,“precisionMode”同时启用。 量化场景下不支持使用“modelType”,该场景下配置该参数将返回报错ERROR_INVALID_PARAM。  | 
dynamicQuantType  | 
DynamicQuantType  | 
DYNAMIC_QUANT_UNDEFINED  | 
动态量化类型。默认为DYNAMIC_QUANT_UNDEFINED非动态量化。当前版本暂不支持非对称动态量化。  | 
rsv[32]  | 
uint8_t  | 
{0}  | 
预留参数。  | 
 8.0.RC2及后续版本normParam不再支持quantInputScale、quantInputOffset量化参数。
参数  | 
类型  | 
默认值  | 
描述  | 
|---|---|---|---|
quantType  | 
QuantType  | 
QUANT_UNQUANT  | 
量化类型。 当前支持以下类型。 
  | 
epsilon  | 
float  | 
1e-5  | 
Epsilon,归一化时加在分母上防止除0。  | 
hasBias  | 
bool  | 
false  | 
是否叠加偏置。默认为False,当需要输入beta时设置为True。 量化场景下不支持使用“hasBias”,该场景下配置该参数将返回报错ERROR_INVALID_PARAM。  | 
rsv[23]  | 
uint8_t  | 
{0}  | 
预留参数。  | 
 8.0.RC2及后续版本PreNormParam不再支持quantInputScale、quantInputOffset量化参数。