使用场景

通常使用在注意力机制attention前和attention与前馈网络ffn之间。
图1 RmsNormOperation算子上下文
参数“rstd”为“true”时使用场景
- 输入：xDim:[8,8,8]; gammaDim:[8]; 输出：rstdDim:[8, 8, 1]
  i
  
  xDimNum - gammaDimNum
  
  condition(i >= (xDimNum - gammaDimNum))
  
  rstdDimNum
  
  0
  
  2
  
  false
  
  xDim[0]
  
  1
  
  2
  
  false
  
  xDim[1]
  
  2
  
  2
  
  true
  
  1
- 输入：xDim:[8,8,8]; gammaDim:[8,8]; 输出：rstdDim:[8, 1, 1]
  i
  
  xDimNum - gammaDimNum
  
  condition(i >= (xDimNum - gammaDimNum))
  
  rstdDimNum
  
  0
  
  1
  
  false
  
  xDim[0]
  
  1
  
  1
  
  true
  
  1
  
  2
  
  1
  
  true
  
  1
- 输入：xDim:[8,16,32]; gammaDim:[8,16,32]; 输出：rstdDim:[1, 1, 1]
  i
  
  xDimNum - gammaDimNum
  
  condition(i >= (xDimNum - gammaDimNum))
  
  rstdDimNum
  
  0
  
  0
  
  true
  
  1
  
  1
  
  0
  
  true
  
  1
  
  2
  
  0
  
  true
  
  1

父主题： RmsNormOperation（代码开放）