大语言模型列表

MindIE支持的大语言模型列表如下所示。
MoE(Mixture-of-Experts,混合专家模型)
模型名称 |
多卡能力 |
数据类型 |
量化 |
MTP |
数据并行 |
负载均衡 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|---|---|---|
DeepSeek-R1-670B |
|
|
|
仅Atlas 800I A2 推理服务器(64G)支持 |
TP+DP+EP+SP |
仅Atlas 800I A2 推理服务器(64G)支持 |
MindIE Service:支持 |
Atlas 800I A2 推理服务器(64G)支持的长度最长为128K |
|
DeepSeek-V2-Lite-16B |
|
|
W8A16量化:仅Atlas 800I A2 推理服务器支持 |
不支持 |
不支持 |
不支持 |
MindIE Service:支持 |
Atlas 800I A2 推理服务器(64G)支持的长度最长为128K |
|
DeepSeek-V2-236B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器(64G)支持 |
不支持 |
不支持 |
不支持 |
MindIE Service:支持 |
Atlas 800I A2 推理服务器(64G)支持的长度最长为128K |
|
DeepSeek-V3-670B |
|
|
|
仅Atlas 800I A2 推理服务器(64G)支持 |
TP+DP+EP+SP |
仅Atlas 800I A2 推理服务器(64G)支持 |
MindIE Service:支持 |
Atlas 800I A2 推理服务器(64G)支持的长度最长为128K |
|
Mixtral-8x7B-Instruct-V0.1 |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
不支持 |
不支持 |
不支持 |
MindIE Service:支持 |
不支持 |
|
Mixtral-8x22B-Instruct-V0.1 |
|
|
不支持 |
不支持 |
不支持 |
不支持 |
MindIE Service:支持 |
不支持 |
|
Qwen2-57B-A14B |
|
|
不支持 |
不支持 |
不支持 |
不支持 |
MindIE Service:支持 |
不支持 |
Baichuan
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
Baichuan2-7B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
|
Baichuan2-13B |
|
|
|
MindIE Service:支持 |
不支持 |
Bloom
ChatGLM
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
ChatGLM3-6B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
|
GLM4-9B |
|
|
|
MindIE Service:支持 |
CodeLLaMA
DeepSeek
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
DeepSeek-R1-Distill-Llama-8B |
|
|
|
MindIE Service:支持 |
不支持 |
|
DeepSeek-R1-Distill-Llama-70B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
|
DeepSeek-R1-Distill-Qwen-1.5B |
|
|
|
MindIE Service:支持 |
不支持 |
|
DeepSeek-R1-Distill-Qwen-7B |
|
|
|
MindIE Service:支持 |
不支持 |
|
DeepSeek-R1-Distill-Qwen-14B |
|
|
|
MindIE Service:支持 |
不支持 |
|
DeepSeek-R1-Distill-Qwen-32B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
LLaMA
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
LLaMA3-8B |
|
|
不支持 |
MindIE Service:支持 |
不支持 |
|
LLaMA3-70B |
|
|
W8A16量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
|
LLaMA3.1-8B |
|
|
|
MindIE Service:支持 |
不支持 |
|
LLaMA3.1-70B |
|
|
|
MindIE Service:支持 |
||
LLaMA3.1-405B |
|
|
不支持 |
MindIE Service:支持 |
不支持 |
Qwen
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
Qwen2-7B |
|
|
|
MindIE Service:支持 |
不支持 |
|
Qwen2-72B |
|
|
|
MindIE Service:支持 |
Atlas 800I A2 推理服务器(64G)支持的长度最长为128K |
|
Qwen2.5-7B |
|
|
|
MindIE Service:支持 |
不支持 |
|
Qwen2.5-14B |
|
|
|
MindIE Service:支持 |
不支持 |
|
Qwen2.5-32B |
|
|
W8A8量化:仅Atlas 800I A2 推理服务器支持 |
MindIE Service:支持 |
不支持 |
|
Qwen2.5-72B |
|
|
|
MindIE Service:支持 |
不支持 |