功能说明 MLA场景下的paged attention,使用分页管理的kvcache计算attention score,额外支持分离qnope/qrope、ctkv/krope的输入。 父主题: MultiLatentAttentionOperation(代码开放)