训练执行(配置文件方式设置资源信息)
准备ranktable资源配置文件
进行训练之前,需要准备
昇腾AI处理器
资源配置文件(即Rank table文件),并上传到当前运行环境,该文件用于定义参与训练的
昇腾AI处理器
资源信息。
执行训练
通过ranktable文件配置好参与分布式训练的资源信息后,可参考本节拉起训练进程,执行训练。
父主题:
执行分布式训练