模型训练和保存

按照去除固定随机性(可不开启确定性计算)执行后,尽量缩小模型的保存步数间隔,例如间隔5步保存一次,保证能够在合理的时间内复现精度异常问题,取得loss异常发生后的最近一步的模型文件,和正常训练时相同步数的模型文件进行对比。