功能列表
RmsNorm
- 非量化
- 训练rmsnormforward算子,设置rstd为true开启。
- precisionMode默认HIGH_PRECISION_MODE,中间计算使用float类型。HIGH_PERFORMANCE_MODE,在最后做gamma(weight)的乘法计算的时候使用float16类型。
- modelType默认LLAMA_MODEL,使用llama模型的rmsnorm公式。GEMMA_MODEL,使用gemma模型的rmsnorm公式。区别在乘gamma(weight)前,会将gamma+1再做乘法。
- 量化
- rmsnorm量化。
- dynamicQuantType默认值DYNAMIC_QUANT_UNDEFINED(普通量化)DYNAMIC_QUANT_SYMMETRIC 动态对称量化。
add+RmsNorm融合(Prenorm,PostNorm)在做rmsnorm前,将x和residual相加
- 非量化
- PreNorm返回add+residual的结果,PostNorm不返回
- hasBias参数。为true时,可以输入bias tensor。为false时,不输入bias tensor。
- 量化
只有Prenorm支持。