压缩mask

功能

又名mask-free。

在长序列场景下,由于seqLen较大,需要的mask的大小也会变大。此时可开启此功能,传入压缩后的mask,以减小显存占用。

开启方式

参数“isTriuMask”置为1。

alibi压缩mask场景需传入slopes。

特殊约束