下载
中文
注册

昇腾支持阶跃星辰Step 3.5 Flash Agent模型推理部署,共筑AI生态新标杆

产业

发表于 2026/02/05

2月2日,阶跃星辰发布新一代开源 Agent 基座模型 Step 3.5 Flash。该模型面向实时 Agent 工作流场景打造,兼顾推理速度、智能水平与使用成本,提供了一个“更快更强更稳”的 Agent 底层模型选项。昇腾凭借卓越的全互联高带宽设计,满足多Agent在规模化部署中的长序列、高并发、低时延需求,在等效算力下性能持平海外友商,携手推动Agent技术从实验室走向实际应用,共筑AI生态新标杆。

权重下载https://gitcode.com/gh_mirrors/st/Step-3.5-Flash

体验链接https://github.com/vllm-project/vllm-ascend/pull/6546


Step 3.5 Flash模型总参数量达1960亿,采用创新稀疏MoE架构,每个Token仅激活约110亿参数,在兼顾强大推理能力与Agent智能的同时,大幅提升了复杂工作流中的响应速度,可高效支撑多场景Agent开发需求,为开发者提供稳定可靠、高性价比的底层支撑,推动Agent真正融入日常开发工作;

1、具备强大的推理能力与 Agent 智能,为 Agent 而生:

更快:推理速度最高 350 TPS(单请求代码类任务)

更强:在 Agent 场景和数学任务上媲美闭源模型

更稳:胜任复杂、长链条任务


2、值得信任、响应迅速、成本可控的模型

稀疏 MoE 架构:每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)

MTP-3:模型一次预测 4 个 Token,效率翻倍

3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention):长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文


生态协同共生,共赴下一代Agent技术新征程

昇腾始终秉持“硬件开放、软件开源,使能伙伴,发展人才”的生态战略,此次对Step 3.5 Flash实现0day适配,彰显了昇腾生态对合作伙伴技术创新的快速响应能力与深厚技术积淀,持续强化自主创新算力与模型的协同优势。

目前,阶跃星辰已正式启动Step 4模型的训练工作,作为长期战略合作伙伴,昇腾将全程相伴,持续发挥全栈优势,为Step 4模型开发提供技术支持,助力阶跃星辰突破模型性能上限,探索智能的全新边界。

未来,昇腾将持续深耕算力技术创新,完善开源生态布局,赋能更多合作伙伴实现技术突破与场景落地,让高效算力赋能千行百业,为数字经济高质量发展注入强劲AI动力。

下一篇

昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源