BNSD维度输入

功能

一般的,传入SelfAttention算子的q,k,v的维度为[batch, seqLen, headNum, head_dim],即[b, s, n, d],或者是它合轴后的变种。在某些场景下,传入[b, n, s, d]性能更好。

开启方式

参数“inputLayout”置为TYPE_BNSD。

输入参数如下:

特殊约束