安装前,需要检查以下硬件配置,如表1所示。
类型 |
配置参考 |
---|---|
服务器(单机场景) |
Atlas 800 训练服务器(型号:9000) |
服务器(集群场景) |
计算节点:Atlas 800 训练服务器(型号:9000) |
存储节点:存储服务器 |
|
内存 |
>64GB |
磁盘空间 |
>1TB 磁盘空间规划请参见表3 |
网络 |
|
安装前,需要完成以下环境的安装,如表2所示。
软件 |
版本 |
安装位置 |
获取方式 |
---|---|---|---|
操作系统 |
|
所有节点 |
- |
Python |
3.7~3.10版本 |
计算节点 |
用户安装 |
expect |
1.1及以上版本 |
管理节点 |
用户安装 |
Torch |
1.11.0 |
计算节点 |
用户安装 |
操作系统磁盘分区推荐如表3所示。