MindIO ACP 组件应用场景CheckPoint是模型中断训练后恢复的关键点,CheckPoint的密集程度、保存和恢复的性能较为关键,它可以提高训练系统的有效吞吐率。MindIO ACP针对CheckPoint的加速方案,支持昇腾产品在LLM模型领域扩展市场空间。 组件功能在大模型训练中,使用训练服务器内存作为缓存,对CheckPoint的保存及加载进行加速。 组件上下游依赖图1 MindIO ACP 父主题: 组件介绍