下载
中文
注册
多机无法拉起DeepSeek-R1模型,modeling_utils.py报错

多机无法拉起DeepSeek-R1模型,modeling_utils.py报错

2025/03/07

169

暂无评分
我要评分

问题信息

问题来源产品大类关键字
现网模型推理TLS,HCCL,AllReduce,通信,DeepSeek,推理

问题现象描述

在服务化拉起过程中,若出现if metadata.get("format") not in ["pt", "tf", "flax", "mix"]: AttributeError: "NoneType" object has no attribute 'get';报错。

原因分析

输入的权重中缺少metadata字段。

解决措施

  1. 排查日志modeling_utils.py报错。
  1. 安装更新transformers版本为 4.46.3。

本页内容