昇腾社区首页
中文
注册
开发者
下载

多模态模型推理服务时报错:RuntimeError: call calnnCat failed, detail:EZ1001

问题描述

多模态模型推理服务时,文件MindIE-LLM-master\examples\atb_models\atb_llm\models\qwen2_vl\flash_causal_qwen2_using_mrope.py出现类似以下报错提示:

call calnnCat failed, detail:EZ1001: xxxxxxxx dimnum of tensor 5 is [1], should be equal to tensor 0 [2].
图1 报错信息
图2 报错文件1
图3 报错文件2

原因分析

可能是concat相关的某个算子,tensor 5在某个维度上是1,与要求的维度上是2大小不一致。可能与squeeze有关,因为squeeze会去掉大小为1的维度。

示例:如果某个算子(如:concat、matmul等),希望这个维度存在并匹配某个值(如:2),那被squeeze删除后shape就会报错。

MindIE 2.0之前的版本存在该问题,MindIE 2.0版本之后都已修复。

解决方案

修改代码,如下所示: