大语言模型列表
MindIE支持的大语言模型列表如表1所示。
模型名称 |
多卡能力 |
数据类型 |
量化 |
服务化 |
长序列 |
模型权重链接 |
---|---|---|---|---|---|---|
Baichuan2-7B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Baichuan2-13B |
|
|
|
|
不支持 |
|
Bloom-7B |
|
|
不支持 |
不支持 |
不支持 |
|
Bloom-176B |
|
|
|
不支持 |
不支持 |
|
ChatGLM3-6B |
|
|
不支持 |
|
不支持 |
|
CodeGeeX2-6B |
|
|
W8A8量化:仅 |
|
不支持 |
|
CodeLLaMA-34B |
|
|
|
|
不支持 |
|
CodeShell-7B |
|
|
不支持 |
不支持 |
不支持 |
|
DeepSeek-V2-Lite-16B |
|
|
W8A16量化:仅 |
不支持 |
不支持 |
|
DeepSeek-V2-236B |
|
|
W8A16量化:仅 |
不支持 |
不支持 |
|
Gemma-7B |
|
|
W8A8量化:仅 |
不支持 |
不支持 |
|
GLM4-9B |
|
|
|
|
||
GPT-NEOX-20B |
|
|
不支持 |
不支持 |
不支持 |
|
InternLM-20B |
|
|
不支持 |
不支持 |
不支持 |
|
InternLM2-7B |
|
|
不支持 |
不支持 |
不支持 |
|
InternLM2-20B |
|
|
不支持 |
|
||
LLaMa-7B |
|
|
不支持 |
不支持 |
不支持 |
|
LLaMa-13B |
|
|
不支持 |
不支持 |
不支持 |
|
LLaMa-33B |
|
|
稀疏量化:仅Atlas 300I Duo 推理卡支持 |
不支持 |
不支持 |
|
LLaMa-65B |
|
|
W8A16量化:仅 |
|
不支持 |
|
LLaMa2-7B |
|
|
|
|
不支持 |
|
LLaMa2-13B |
|
|
|
|
不支持 |
|
LLaMa2-70B |
|
|
|
|
不支持 |
|
LLaMA3-8B |
|
|
不支持 |
|
不支持 |
|
LLaMA3-70B |
|
|
W8A16量化:仅 |
|
不支持 |
|
LLaMA3.1-8B |
|
|
|
|
不支持 |
|
LLaMA3.1-70B |
|
|
|
|
||
Mixtral-8x7B-Instruct-V0.1 |
|
|
W8A8量化:仅 |
|
不支持 |
|
Mixtral-8x22B-Instruct-V0.1 |
|
|
不支持 |
|
不支持 |
|
Qwen-7B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Qwen-14B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Qwen-72B |
|
|
W8A16量化:仅 |
|
不支持 |
|
Qwen1.5-0.5B |
|
|
不支持 |
不支持 |
不支持 |
|
Qwen1.5-1.8B |
|
|
不支持 |
不支持 |
不支持 |
|
Qwen1.5-4B |
|
|
不支持 |
不支持 |
不支持 |
|
Qwen2-57B-A14B |
|
|
不支持 |
|
不支持 |
|
Qwen2-7B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Qwen2-72B |
|
|
|
|
||
Qwen2.5-7B |
|
|
不支持 |
|
不支持 |
|
Qwen2.5-14B |
|
|
不支持 |
|
不支持 |
|
Qwen2.5-32B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Qwen2.5-72B |
|
|
W8A8量化:仅 |
|
不支持 |
|
StarCoder-15.5B |
|
|
W8A8量化:支持 |
|
不支持 |
|
StarCoder2-15B |
|
|
W8A8量化:仅 |
|
不支持 |
|
Vicuna-7B |
|
|
不支持 |
不支持 |
不支持 |
|
Vicuna-13B |
|
|
不支持 |
不支持 |
不支持 |
|
Yi-6B-200K |
|
|
不支持 |
不支持 |
不支持 |
|
Yi-34B-200K |
|
|
不支持 |
不支持 |
||
Ziya-Coding-34B |
|
|
不支持 |
不支持 |
不支持 |