系统约束与限制
- 该文档仅配套TensorFlow 1.15版本使用。
- 当前版本不支持float64、complex64、complex128、DT_VARIANT数据类型。
- 目前系统支持的数据format主要有NCHW、NHWC、NC、HWCN、CN。
- 条件分支、循环分支只支持tf.cond、tf.while_loop、tf.case。
- 多卡训练时,NPURunconfig不支持tf.estimator.RunConfig中的配置参数save_checkpoints_secs。
- 多卡训练时,不支持仅保存单卡的Summary信息(tf.summary接口)。
- 针对
Atlas 训练系列产品 ,算子不支持inf/nan输入。 - 数据预处理约束:当前不支持queue方式读取数据,仅支持dataset和placeholder方式。
- 如果使用python的多进程包multiprocessing创建多进程,请不要使用fork方法,建议使用forkserver方法。
因为在Python3.8~Python3.11版本中如果使用fork方法,在创建子进程时可能会复制主进程的锁状态,而在子进程里再触发获取锁时,就会导致死锁,进而导致业务进程卡死。