昇腾社区首页
中文
注册
开发者
下载

特性叠加

本章节提供DeepSeek模型和Qwen模型的特性叠加说明。

:表示全部支持

:表示部分支持

:表示不支持

DeepSeek模型

DeepSeek模型支持的特性叠加情况如下所示。

[1]:MTP和CP叠加:PD分离场景时,仅P节点支持;PD混部场景只支持CP和MTP=1的叠加。

[2]:MTP和SP叠加:PD分离场景时,仅P节点支持;PD混部场景只支持CP和MTP=1的叠加。

Qwen模型

Qwen模型支持的特性叠加情况如下所示。

[1]:仅Qwen3系列支持思考解析。

[2]:仅Qwen2.5和Qwen3系列支持Function Call。

[3]:仅Qwen2和Qwen2.5系列支持Prefix Cache。