动态shape模型输入大小校验失败
适用场景
- 业务场景:昇腾模型算法,模型转化、应用/算子开发、TensorFlow训练
- 适用处理器:Atlas 200/300/500 推理产品、Atlas 推理系列产品、Atlas 训练系列产品
- 处理器形态:EP、RC
现象描述
动态shape模型输入大小校验失败,日志信息中包含以下关键信息:tensor size mismatches. expected: ..., but given ...
可能原因
动态shape场景每个node都会在执行时对shape进行推导,该故障现象可能为算子的shape校验不合法。
解决措施
针对分析的故障可能原因,应根据图上的连接关系,对shape的来源进行排查,找出不合理的shape推导:
可搜索执行plog日志查看关键词:
"before_infershape when running":显示算子shape推导前的输入、输出shape等信息。
“after_infershape when running ”:显示算子shape推导后的输入、输出shape等信息。
从报错节点的输入、输出shape开始进行排查, 检查当前节点shape推导结果是否正确(即判定根据输入shape推出的输出shape是否符合预期), 如果是输入shape存在问题,则按照相同方法继续排查输入节点的shape推导。
父主题: 常见故障分析与处理