资源

KTransformers 基于昇腾适配 Kimi-K2-Thinking 模型,实现高效推理

生态伙伴

发表于 2025/11/10

11月6日,月之暗面正式发布 Kimi-K2-Thinking 模型,昇腾与趋境科技开源项目KTransformers通过深度适配已实现对该模型的高效推理。

Kimi K2 Thinking 是基于「模型即 Agent」理念训练的新一代 Thinking Agent,掌握「边思考,边使用工具」的能力。在人类最后的考试(Humanity's Last Exam)、自主网络浏览能力(BrowseComp)、复杂信息收集推理(SEAL-0)等多项基准测试中表现达到 SOTA 水平,并在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升,无需人类干预,即可自主实现高达 300 轮的工具调用和持续稳定的多轮思考能力,从而帮助用户解决更复杂的问题。

KTransformers通过创新的异构计算架构,充分发挥了昇腾的计算优势,实现了模型推理的性能优化,为超大规模的推理应用提供了可靠的算力基础。

目前,基于昇腾的kimi-k2-thinking模型推理功能将够满足各类AI推理场景的需求,此次技术整合展现了昇腾生态与开源社区的紧密协作,为前沿AI模型在更多行业场景应用落地奠定了坚实基础。

更多请访问KTransformers GitHub 主页:

https://github.com/kvcache-ai/ktransformers

上一篇

昇腾CANN开源开放沙龙 | 11月14日浙江站邀请函请您查收

下一篇

昇腾后训练强化学习最佳实践