华为计算微信公众号
昇腾AI开发者公众号
华为计算微博
华为计算今日头条
昇腾社区首页
中文
注册
登录
开发者
主页
开发
开发场景
训练开发
NEW
推理开发
算子开发
开发资源
资源下载中心
固件与驱动
昇腾镜像仓库
兼容性查询助手
ModelZoo
昇腾开放资源
专区
开发板专区
Deepseek专区
文档
活动
活动
华为全联接大会2025-开发者日
HOT
社区推荐官2025
NEW
昇腾AI训练营-CANN训练营
昇腾AI开发者创享日
鲲鹏昇腾开发者大会2025
大赛
昇腾AI创新大赛2025
昇腾AI创新大赛-算子挑战赛
昇腾AI创新大赛-昇思模型开发挑战赛
NEW
直播
学习
学习主页
学习路径
在线课程
在线实验
认证
论坛
博客
昇腾博客
NEW
技术干货
开发者计划
昇腾开发者计划2025
昇腾众智计划
昇腾荣誉顾问
昇腾MVP
昇腾HAE
鲲鹏昇腾创新汇
下载
支持
积分兑换
NEW
通信加速
整网时延
100+%
小batch、权重预取双流并行、多算力软硬协同通信
解码优化
整网时延
30~60%
MTP、DraftDecoding解码
量化压缩
吞吐
30%
Int8混合量化、自适应精度保持
最优并行
吞吐
3x
SPDTE混合并行、最优并行搜索
调度优化
吞吐
50%
PD分离、多机推理调度