资源

中移九天35B大模型基于昇腾深度适配,实现高性能推理

产业

发表于 2026/04/27

中国移动自主研发的九天35B通用大模型即将在数字中国峰会重磅发布,以强大的语言理解、复杂推理与行业场景适配能力,将成为央企自研大模型的标杆之作。中移九天大模型作为中国移动 “九天” 基座核心产品,具备高安全、高可控、全自主的央企特性,已通过生成式 AI 服务双备案与 A 级安全认证,广泛适配行业数智化转型场景。昇腾作为中移九天最重要的战略合作伙伴,全面支持九天35B大模型在昇腾全系列产品上高效部署,为该模型的高速推理部署提供坚实底座。

本次九天 35B 模型与昇腾910深度适配,打通端到端推理全链路。依托自主创新最强算力,通过Cube 张量计算核心完成张量运算硬件加速,充分释放硬件潜能。依托 CANN异构计算架构,通过动态内存分配、图模式、Triton融合算子等适配优化手段,减少内存占用,显著提升推理性能。


  • 动态内存分配

根据推理过程中的实际负载动态调整内存资源使用方式,提升内存利用率,减少静态预留带来的浪费。在有限内存条件下,可支撑更大模型和更高并发场景稳定运行。

  • 图模式优化

将原本离散的计算过程进行图化编排和统一调度,减少运行时重复开销与调度损耗。通过提升执行链路的整体协同性,进一步优化时延表现和推理稳定性。

  • Triton融合算子

对多个高频计算操作进行融合,减少中间数据读写和算子切换开销,提升性能。在提升单次执行效率的同时,有助于进一步释放底层硬件算力潜能,提升整体吞吐表现。


昇腾与中移九天始终保持紧密协同,围绕超万卡国产算力底座、大模型技术创新和行业场景应用等方面开展了全方位、深层次合作。依托昇腾领先的AI算力底座、以及昇思MindSpore等基础软件生态,九天成功孵化全规模、全尺寸、全场景的大模型矩阵。双方共同推动“九天大模型”在训练和推理等方面持续演进,打造自主的计算生态,让AI“用得起、用得好”,更能“用得放心”。面向未来,双方将进一步发挥各自优势,持续深化在智算超节点集群、大模型底座能力和行业场景落地等领域的联合创新,携手打造央企AI自主创新标杆,为推动我国人工智能产业高质量发展注入强劲动能。

上一篇

DeepSeek V4官宣发布,昇腾量化模型社区同步上线

下一篇

金融智能新跨越:中国银联依托昇腾算力率先完成DeepSeek-V4私有化部署