昇腾社区首页
中文
注册
开发者
下载

新增特性

编号

模块

详细

1

MindIE Motor

  • Coordinator主备份可靠性增强(HA_Proxy方式更换为ETCD方式)。
  • 灵衢HCCL链路故障BGP切路支持推理业务快速恢复。
  • 大规模专家并行场景同步globalranktable时延优化。

2

MindIE LLM

  • 新增支持mooncake池化能力(支持叠加CP/SP)。
  • 接口功能补充,新增输出字段cached_tokens(推理过程中命中的缓存令牌数量)和reasoning_tokens(思维链内容对应的令牌数量)。
  • Qwen235B支持BF16的大规模专家并行场景推理。
  • CP/SP特性支持与C8、Prefix Cache特性叠加使用。
  • DeepSeek V3.1单双机新增支持W4A8C8。

3

MindIE SD

  • 优化MindIE SD发布调优指南使能用户自主调优。
  • 多模态模型超规格输入下服务的稳定性和易用性提升。