已知问题
问题一
问题描述 |
ScaledMaskedSoftmaxGrad算子部分float16用例精度失败 |
---|---|
严重级别 |
一般 |
根因分析 |
随路指令在某个随机数转换触发概率问题 |
缺陷影响 |
模型场景无该shape,且模型调用方式不存在该问题 |
规避方案 |
已转为需求 |
问题二
问题描述 |
MMV3_多核切K特性泛化用例在走进多核切K的场景下,相比MMV2,部分性能劣化超过10%-25%,包括多和且K带bias场景 |
---|---|
严重级别 |
一般 |
根因分析 |
切换到多核切K新特性场景时无法准确区分边界条件,导致部分shape从mmv2切换到多核切K模板后性能劣化 |
缺陷影响 |
该特性交付后,未有客户面网络中反馈出现性能劣化,影响小 |
规避方案 |
修改知识库中的配置文件,将matmul多核切K的切分方式调整回之前的切分方式 |
问题三
问题描述 |
QuantMatmulV3全量化A8W8性能优化,泛化用例性能劣化超过10% |
---|---|
严重级别 |
一般 |
根因分析 |
从老tiling切换到新tiling和模板时无法准确区分边界条件,导致部分shape切换后性能下降 |
缺陷影响 |
此类场景自2024/9月该特性交付后,未有客户网络中反馈出现性能劣化问题,影响小。 |
规避方案 |
修改知识库中的配置文件,将新tiling的切分方式调整回老tiling的切分方式 |
父主题: 已知问题和已修复问题