数据加载优化

在PyTorch模型中,数据加载部分的逻辑一般是DataLoader及其衍生类,在DataLoader加载数据中,要注意以下两个核心点:

硬件类

参数类

DataLoader入参:
  • 在内存允许的情况下,保持pin_memory=True。
  • 一般而言,可以加上persistent_workers=True,该设置可以减小进程销毁或申请的开销,不过这个方法也可能带来内存瓶颈。

代码技巧类