初始化MindIO TFT Controller模块。
mindio_ttp.framework_ttp.tft_init_controller(rank: int, world_size: int, enable_local_copy: bool, enable_arf=False)
参数 |
是否必选 |
说明 |
取值要求 |
---|---|---|---|
rank |
必选 |
当前执行训练任务的NPU卡号。 |
int,[-1, world_size)。MindCluster在Torch Agent进程拉起Controller时rank值取-1。 |
world_size |
必选 |
整个集群参与训练任务的卡数。 |
int,[1, 100000]。 |
enable_local_copy |
必选 |
表示是否启用local copy。优化器更新前,先对优化器做一次备份。 |
|
enable_arf |
可选 |
MindIO ARF特性开关。 |
默认为False。 |
无返回值,出错会打印ERROR日志、抛出异常。