安装依赖
为保证RAG SDK的正常使用,需要安装相关依赖。
- 如果在物理机内部署RAG SDK,需要安装表1中的所有依赖包。
- 如果在容器内部署RAG SDK,需要在宿主机上安装npu-driver驱动包、npu-firmware固件包和Ascend Docker Runtime,并启动MindIE推理服务,其他操作请参考容器内部署RAG SDK。
下载依赖软件包
软件包简称 |
安装包全名 |
配套版本 |
获取链接 |
---|---|---|---|
CANN软件包 |
Ascend-cann-toolkit_<version>_linux-<arch>.run |
8.2.RC1 |
|
二进制算子包Kernels |
Ascend-cann-kernels-<chip_type>_<version>_linux-<arch>.run |
||
NNAL加速库(可选) |
Ascend-cann-nnal_<version>_linux-<arch>.run |
||
npu-driver驱动包 |
Ascend-hdk-<chip_type>-npu-driver_<version>_linux-<arch>.run |
25.2.0 |
|
npu-firmware固件包 |
Ascend-hdk-<chip_type>-npu-firmware_<version>.run |
||
Index SDK检索软件包 |
Ascend-mindxsdk-mxindex_<version>_linux-<arch>.run |
7.1.RC1 |
|
MindIE推理引擎软件包 |
Ascend-mindie_<version>_linux-<arch>.run |
2.1.RC1 |
|
Ascend Docker Runtime |
Ascend-docker-runtime_<version>_linux-<arch>.run |
7.1.RC1 |
|
Python |
- |
3.11 |
安装依赖
- 安装NPU驱动固件,详细步骤请参见《CANN 软件安装指南》中的“安装NPU驱动和固件”章节(商用版)或“安装NPU驱动和固件”章节(社区版)内容。为了让非root用户能够使用驱动,安装驱动时需添加--install-for-all选项。
- 可选:安装CANN Toolkit、Kernels和NNAL加速库,详细步骤请参见《CANN 软件安装指南》中的“安装依赖”和“安装CANN软件包”章节。建议以普通用户HwHiAiUser进行安装。如果使用AscendHub镜像部署RAG SDK,无需执行该步骤。
- 安装并运行推理大模型,详细步骤请参见《MindIE安装指南》中的“方式三:容器部署方式”章节和“配置MindIE Server”章节。
- 安装Ascend Docker Runtime,详细步骤请参见《MindCluster 集群调度安装指南》的“安装部署”章节。
父主题: 安装部署