昇腾社区首页
中文
注册

多模态理解模型列表

  • 以下模型需配合ATB Models模型库使用,ATB Models的安装方式请参见《MindIE安装指南》中的“安装MindIE > 方式二:物理机安装方式 > 环境准备 > 安装ATB Models”章节;ATB Models的使用场景请参见《MindIE LLM开发指南》中的“模型推理使用流程 > ATB Models使用”章节
  • 当前版本多模态理解模型不支持量化。

GLM-4

模型名称

多卡能力

数据类型

服务化

模型权重链接

GLM-4V-9B

  • Atlas 800I A2 推理服务器(64G):支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:不支持
  • BF16:仅Atlas 800I A2 推理服务器(64G)支持

MindIE Service:支持

链接

MiniCPM-V

模型名称

多卡能力

数据类型

服务化

模型权重链接

MiniCPM-V2.6-8B

  • Atlas 800I A2 推理服务器:支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:支持的卡数为1、2或4。
  • FP16:支持
  • BF16:仅Atlas 800I A2 推理服务器支持

MindIE Service:支持

链接

InternVL

模型名称

多卡能力

数据类型

服务化

模型权重链接

InternVL2-8B

  • Atlas 800I A2 推理服务器:支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:不支持

MindIE Service:支持

链接

InternVL2-40B

  • Atlas 800I A2 推理服务器:支持的卡数为2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:仅Atlas 800I A2 推理服务器(64G)支持

MindIE Service:支持

链接

InternVL2.5-8B

  • Atlas 800I A2 推理服务器:支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:不支持

MindIE Service:支持

链接

InternVL2.5-78B

  • Atlas 800I A2 推理服务器:支持的卡数为8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:仅Atlas 800I A2 推理服务器(64G)支持

MindIE Service:支持

链接

Qwen-VL

模型名称

多卡能力

数据类型

服务化

模型权重链接

Qwen-VL-9.6B

  • Atlas 800I A2 推理服务器(32G):支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:支持的卡数为1、2或4。
  • FP16:支持
  • BF16:仅Atlas 800I A2 推理服务器(32G)支持

MindIE Service:支持

链接

Qwen2-Audio

模型名称

多卡能力

数据类型

服务化

模型权重链接

Qwen2-Audio-7B-Instruct

  • Atlas 800I A2 推理服务器:支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:支持
  • BF16:仅Atlas 800I A2 推理服务器支持

MindIE Service:支持

链接

Qwen2-VL

模型名称

多卡能力

数据类型

服务化

模型权重链接

Qwen2-VL-7B

  • Atlas 800I A2 推理服务器:支持的卡数为1、2、4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:仅Atlas 800I A2 推理服务器支持

MindIE Service:支持

链接

Qwen2-VL-72B

  • Atlas 800I A2 推理服务器:支持的卡数为4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:仅Atlas 800I A2 推理服务器支持
  • BF16:仅Atlas 800I A2 推理服务器支持

MindIE Service:支持

链接

Qwen2.5-VL

模型名称

多卡能力

数据类型

服务化

模型权重链接

Qwen2.5-VL-72B

  • Atlas 800I A2 推理服务器:支持的卡数为4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:不支持
  • BF16:仅Atlas 800I A2 推理服务器(64G)支持

MindIE Service:支持

链接

QVQ

模型名称

多卡能力

数据类型

服务化

模型权重链接

QVQ-72B-Preview

  • Atlas 800I A2 推理服务器:支持的卡数为4或8。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:不支持
  • BF16:仅Atlas 800I A2 推理服务器支持

MindIE Service:支持

链接

VITA

模型名称

多卡能力

数据类型

服务化

模型权重链接

VITA1.5-8B

  • Atlas 800I A2 推理服务器:支持的卡数为1。
  • Atlas 300I Duo 推理卡:不支持。
  • FP16:不支持
  • BF16:仅Atlas 800I A2 推理服务器(64G)支持

MindIE Service:支持

链接