特性叠加
本章节提供DeepSeek模型和Qwen模型的特性叠加说明。
:表示全部支持
:表示部分支持
:表示不支持
DeepSeek模型
DeepSeek模型支持的特性叠加情况如下所示。
[1]:MTP和CP叠加:PD分离场景时,仅P节点支持;PD混部场景只支持CP和MTP=1的叠加。
[2]:MTP和SP叠加:PD分离场景时,仅P节点支持;PD混部场景只支持CP和MTP=1的叠加。
Qwen模型
Qwen模型支持的特性叠加情况如下所示。
[1]:仅Qwen3系列支持思考解析。
[2]:仅Qwen2.5和Qwen3系列支持Function Call。
[3]:仅Qwen2和Qwen2.5系列支持Prefix Cache。
父主题: 特性介绍