多模态模型推理服务时报错:RuntimeError: call calnnCat failed, detail:EZ1001
问题描述
多模态模型推理服务时,文件MindIE-LLM-master\examples\atb_models\atb_llm\models\qwen2_vl\flash_causal_qwen2_using_mrope.py出现类似以下报错提示:
call calnnCat failed, detail:EZ1001: xxxxxxxx dimnum of tensor 5 is [1], should be equal to tensor 0 [2].
图1 报错信息
图2 报错文件1
图3 报错文件2
原因分析
可能是concat相关的某个算子,tensor 5在某个维度上是1,与要求的维度上是2大小不一致。可能与squeeze有关,因为squeeze会去掉大小为1的维度。
示例:如果某个算子(如:concat、matmul等),希望这个维度存在并匹配某个值(如:2),那被squeeze删除后shape就会报错。
MindIE 2.0之前的版本存在该问题,MindIE 2.0版本之后都已修复。
解决方案
修改代码,如下所示:

父主题: FAQ