KTransformers 基于昇腾适配 Kimi-K2-Thinking 模型，实现高效推理

生态伙伴

发表于 2025/11/10

11月6日，月之暗面正式发布 Kimi-K2-Thinking 模型，昇腾与趋境科技开源项目KTransformers通过深度适配已实现对该模型的高效推理。

Kimi K2 Thinking 是基于「模型即 Agent」理念训练的新一代 Thinking Agent，掌握「边思考，边使用工具」的能力。在人类最后的考试（Humanity's Last Exam）、自主网络浏览能力（BrowseComp）、复杂信息收集推理（SEAL-0）等多项基准测试中表现达到 SOTA 水平，并在 Agentic 搜索、Agentic 编程、写作和综合推理能力等方面取得全面提升，无需人类干预，即可自主实现高达 300 轮的工具调用和持续稳定的多轮思考能力，从而帮助用户解决更复杂的问题。

KTransformers通过创新的异构计算架构，充分发挥了昇腾的计算优势，实现了模型推理的性能优化，为超大规模的推理应用提供了可靠的算力基础。

目前，基于昇腾的kimi-k2-thinking模型推理功能将够满足各类AI推理场景的需求，此次技术整合展现了昇腾生态与开源社区的紧密协作，为前沿AI模型在更多行业场景应用落地奠定了坚实基础。

更多请访问KTransformers GitHub 主页：

https://github.com/kvcache-ai/ktransformers

昇腾CANN开源开放沙龙 | 11月14日浙江站邀请函请您查收

昇腾后训练强化学习最佳实践

KTransformers 基于昇腾适配 Kimi-K2-Thinking 模型，实现高效推理

关于昇腾

新闻与活动

交流与资讯

支持与服务

开源社区

Links