PreProcess是对Q、K、V、mask的前置处理,如开启反量化融合功能时计算前要对输入K、V进行反量化。
attenOut由attention计算得出,其中Zoom为对的缩放,标准计算流程中是乘以1/sqrt(head_size),当logN功能开启时,额外乘以logN的系数。