昇腾社区首页
中文
注册
登录
开发者
主页
开发
文档
活动
学习
论坛
博客
开发者计划
更多
0
/100
下载
支持
积分兑换
NEW
功能说明
基于传统flash attention按照layerId管理kvcache的机制计算attention score。
父主题:
SelfAttentionOperation(代码开放)