昇腾社区首页
中文
注册
开发者
下载

Docker场景部署DeepSeek

前提条件

  • 已完成DeepSeek模型权重文件的准备。
  • 已完成Docker组件安装且Docker状态正常,Docker组件需为24.0.0及以上版本。
  • 已完成参数面网络配置

使用约束

  • 暂仅支持Atlas 800I A2 推理服务器(64GB HCCS款)单机和双机场景、Atlas 800I A3 超节点服务器的单机场景下使用。
  • 执行部署DeepSeek前,待部署节点须进行hccn_tool网络配置,参考步骤 1仅修改配置HCCN变量区域。

配置参数填写示例如下,单机填写一台worker信息;双机填写两台worker信息,同时指定mindie_master。参数说明请参见表1表2

[worker]
xx.xx.xx.77 ansible_ssh_user="******" ansible_ssh_pass="******"  
xx.xx.xx.87 ansible_ssh_user="******" ansible_ssh_pass="******." 

[all:vars]
mindie_master="xx.xx.xx.77"
weight_mount_path="/home/" # 权重挂载目录,用于后续挂载到PD实例的容器,请确保权重在该目录下model_weight_path="/home/whr/safetensor/" # 权重文件路径
cntr_mnt_path="/home/"
mindie_image_name="" 
mindie_image_file=""
表1 [worker]参数说明

参数

是否可选

说明

IP

必选

服务器的IP地址,支持动态输入多个IP地址。参数说明如下:

  • index:服务器在IP段中的序号,Int类型,默认为1,如 1.1.1.1-1.1.1.3 set_hostname="master-{index}",那1.1.1.1对应的set_hostname=master-1。
  • step_len:IP跳位步长,末尾IP若不在步长内也会保留。如设置1.1.1.1-1.1.1.6 step_len=2,则输出1.1.1.1,1.1.1.3,1.1.1.5,1.1.1.6。
  • 在批量输入的配置{}中,支持解析参数,包含数据运算、转型等,解析后输出字符串类型。如1.1.1.1-1.1.1.3 set_hostname="master-{str(index+20)+'x'}",则解析后的主机信息为1.1.1.1 set_hostname="master-21x" ...。
  • IP段输入参数暂仅支持python3。
  • 当为IPv6时,不支持将IP作为动态参数填入。

ansible_ssh_user

必选

SSH登录远程服务器的账号,需要为root账号。

ansible_ssh_pass

可选

SSH登录远程服务器账号的密码。

如果配置了SSH密钥认证方式且root用户可以登录,则无需配置。

ansible_ssh_port

可选

SSH连接的端口。

使用默认值22端口时无需配置。

如果使用了非默认的其他端口,则需要配置。

表2 [all:vars]参数说明

参数

是否可选

说明

weight_mount_path

必选

宿主机挂载目录,将目录挂载至容器。如:/mnt/mindie_data/

model_weight_path

必选

指定容器内访问权重的路径。如:/mnt/mindie_data/deepseek_diff_level/deepseek_r1_w8a8

mindie_image_name

可选

镜像名称(适配已装载好MindIE镜像)。

如:mindie:dev-2.0.RC1.B091-800I-A2-py311-ubuntu22.04-aarch64

mindie_image_file

可选

共享存储镜像文件地址(适配未装载MindIE镜像)。

如:/mnt/weight/image/mindie_image*.tar.gz

cntr_mnt_path

必选

创建容器时,容器内挂载目录。

mindie_master

可选

双机场景时必选。

双节点时,用于指定MindIE的master节点IP。

  • 若集群中存在MindIE镜像,请填写mindie_image_name;若每个节点中存在MindIE镜像文件,请填写mindie_image_file。两个参数中选一个填写即可,若都填写,则优先使用mindie_image_name;若两个参数都未填写,MindCluster Ascend Deployer将尝试从ascend_deployer/resources/MindIE-image目录下查找镜像文件。
  • 填写mindie_image_name和mindie_image_file参数时,请确保集群环境中都存在对应的MindIE镜像或镜像文件。
  • 使用mindie_image_name时,只需填写master节点,worker节点可不填写。未使用mindie_image_name时,请填写待部署的所有worker节点。