执行安装命令
须知
- 如果是批量安装,参考配置批量安装完成相关配置后,请直接从3开始执行。
- 如果获取的驱动固件包为Ascend-hdk系列(如Ascend-hdk-*-npu_*-{arch}.zip)的软件包时,无需配置cus_npu_info参数。若不是,则Atlas 300I Pro、Atlas 300V Pro、Atlas 300V、A300T-9000和Atlas 300T pro在安装驱动和固件时,必须在inventory_file中提前配置cus_npu_info参数,其中Atlas 300I Pro配置为300i-pro,Atlas 300V Pro配置为300v-pro,Atlas 300V配置为300v,A300T-9000配置为300t,Atlas 300T Pro配置为300t-pro,参考示例如下:
[ascend] localhost ansible_connection='local' cus_npu_info='300i-pro'
安装步骤
- 以软件包的安装用户登录待安装设备。
- 将ascend-deployer整个目录上传到待安装设备的用户家目录(如“$HOME”)下。如果是直接在待安装设备上使用ascend-deployer的下载功能,请忽略此步骤。
- 非root用户使用离线部署工具时,需具有ascend-deployer目录的操作权限。
- 如果是使用root用户安装,且需要其他用户能够使用root用户后续安装的python等,请提前设置环境umask为022,设置前请确认该umask权限符合所在组织的安全要求。
- (可选)root用户安装驱动、CANN软件包时,支持指定驱动的运行用户、用户组(默认为HwHiAiUser,具体请参考准备安装及运行用户)以及CANN软件包、toolbox软件包的安装路径(默认为“/usr/local/Ascend”)。如需指定,可自行修改ascend-deployer/inventory_file文件(以下参数设置仅对root用户安装时有效)。文件内容参考如下:如果待安装环境上已存在全局配置文件“/etc/Ascend/ascend_cann_install.info”和“/etc/Ascend/ascend_toolbox_install.info”,则以下install_path参数无效,以全局配置文件中指定的安装路径为准。
[ascend:vars] user=HwHiAiUser group=HwHiAiUser install_path=/usr/local/Ascend
npu和边缘组件(atlasedge、ha)不支持自行指定安装路径,npu默认安装路径为“/usr/local/Ascend”,边缘组件(atlasedge、ha)默认安装路径为“/usr/local”。
- 进入ascend-deployer目录,执行安装脚本(安装用户需具有install.sh的可执行权限),可根据需要选择安装方式(指定场景安装或指定软件安装)。如果用户是在本机上使用pip安装ascend-deployer,则可在本机任意路径使用ascend-deployer命令进行安装。与执行安装脚本命令的区别是将以下命令中的"./install.sh"替换为"ascend-deployer",如"ascend-deployer --install-scene=auto"。
- 指定场景安装(仅支持root用户)
无论指定何种场景安装,都会自动安装docker,便于进行容器部署。在安装过程中会创建相应的docker组。安装依赖前请确认系统上是否已安装docker,如果已安装,请卸载后再进行系统依赖的安装。
./install.sh --install-scene=<scene_name>
ascend-deployer工具提供几个基本安装场景,具体可参考可选安装场景。命令示例如下:
./install.sh --install-scene=auto //自动安装所有能找到的软件包
- 指定软件安装
如果使用root用户,支持安装ascend-deployer工具下载的所有软件。如果使用非root用户,仅支持安装表1所示软件。请先使用root用户安装完sys_pkg(系统组件)、npu(驱动与固件,为昇腾设备时安装)等后,再使用非root用户安装表1中的软件。
表1 软件列表 软件
说明
Python、gcc
python3.x.x和gcc7.3.0,安装在$HOME/.local/目录下。
框架
包括tensorflow、pytorch、mindspore。
CANN软件
包括nnae、nnrt、tfplugin、toolkit、kernels,安装在$HOME/Ascend目录下。
toolbox
- 安装在$HOME/Ascend目录下。
- 若安装MindX DL 3.0.0之前版本的toolbox时,非root用户安装toolbox会跳过工具包中容器引擎插件Ascend-docker-runtime的安装。如果需要使用Ascend-docker-runtime,请使用root用户安装toolbox。
MindStudio
安装在$HOME目录下。
如果非root用户需要安装MindStudio,请先使用root用户安装MindStudio(部分依赖需要root用户安装)后,再使用非root用户安装MindStudio。
./install.sh --install=<package_name_1>,<package_name_2>
<package_name_x>可选范围可通过执行./install.sh --help查看。命令示例如下:
./install.sh --install=sys_pkg,python,npu //安装系统组件、python、驱动和固件 ./install.sh --install=toolkit //安装toolkit ./install.sh --install=tfplugin //安装tfplugin ./install.sh --install=tensorflow //安装tensorflow ./install.sh --install=ief //安装IEF Agent ./install.sh --install=mindstudio //安装MindStudio
IEF Agent安装完成后,需要登录管理控制台-智能边缘平台,选择左侧导航栏的“边缘资源 > 边缘节点”,在边缘节点列表中查看已纳管的边缘节点状态。如果节点状态为“运行中”,表示纳管成功。
- 请按照“sys_pkg>python>npu>CANN软件包(toolkit、nnrt等)>AI框架(tensorflow、mindspore或pytorch)”的顺序进行安装,安装时resources目录下的CANN包版本需和npu配套。
- 安装TensorFlow时,指定--tensorflow_version=1.15.0或2.6.5,会自动安装指定版本TensorFlow,若未指定,则默认安装TensorFlow 1.15.0版本。
- TensorFlow2.6.5存在漏洞,请参考相关漏洞及其修复方案处理。
- 安装kernels前,需要先安装nnae或toolkit,安装时需指定--kernels_type参数。
- 使用ascend-deployer工具时,如果因为环境变量问题工具无法运行,用户需自行根据环境实际状况配置ASCENDPATH进行处理。
- gcc版本低于7.3.0,ascend-deployer工具会自动安装,该过程耗时较长,用户可通过手动提前升级并配置环境变量。gcc7.3.0安装后需要建立软链接才能使用,例如root安装的gcc7.3.0执行命令ln -sf /usr/local/gcc7.3.0/bin/gcc /usr/bin/gcc。
- 安装npu时,会提前获取设备健康状态。如果设备存在问题,则会终止整个安装过程。
- 安装npu后,请根据安装npu过程中的系统提示信息决定是否重启系统(如需重启,请执行reboot命令)。
- 部分组件存在运行时依赖,如PyTorch需要toolkit或nnae提供运行时依赖,TensorFlow调用npu资源需要tfplugin+toolkit或tfplugin+nnae组合提供运行时依赖,MindSpore需要driver和toolkit提供运行时依赖。
- 所有Python库的安装都必须先安装Python,如TensorFlow、MindSpore、PyTorch等。
- 安装时,运行环境时间需要通过date -s命令校准到正确的UTC时间。
- 其中指定“--install=mindspore”会安装下载操作中下载好的mindspore包,用户也可参考Mindspore官网自行安装,请注意mindspore与驱动、固件、CANN软件的版本配套关系。
- 指定场景安装(仅支持root用户)
- 安装后检查,可通过以下命令检查指定组件能否正常工作。
./install.sh --test=<target>
<target>可选范围可通过执行./install.sh --help查看。命令示例如下:
./install.sh --test=toolbox //测试toolbox是否正常
父主题: 安装过程