Back to Top 功能描述 基于传统flash attention按照layerId管理kvcache的机制计算attention score。 父主题: SelfAttentionOperation