已解决的问题
本次补丁版本主要是进行问题修复,解决Function Call精度、Function Call流式后处理功能、CP精度、稠密模型PrefixCache OOM等问题,具体问题如已解决的问题所示。
序号 |
问题单号 |
问题描述 |
---|---|---|
1 |
DTS2025081410445 |
Deepseek-R1 W8A8量化,Function Call触发率低于预期,增加旋转量化提升精度。 |
2 |
DTS2025090136284 |
Function Call流式后处理丢失字段,修复后处理逻辑。 |
3 |
DTS2025082231860 |
稠密模型PrefixCache OOM,修复warmup阶段逻辑。 |
4 |
DTS2025081409969 |
开启CP存在输入短序列回答乱码,修复CP建链逻辑。 |
5 |
DTS2025082033622 |
开启CP出现重复回答,修复CP padding逻辑。 |
6 |
DTS2025090513254 |
RAS(Reliability、Availability、Serviceability)在Atlas 800I A3 超节点CP场景下失效,修复校验逻辑。 |
7 |
DTS2025091031920 |
Coordinator主备无冗余组网高并发场景出现coredump,修复建链逻辑。 |
父主题: 2.1.RC2更新说明