重捕获次数限制功能(aclgraph)
功能简介
reduce-overhead模式下的功能为试验特性,后续版本可能存在变更,暂不支持应用于商用产品中。
reduce-overhead模式下,由于aclgraph本身不支持动态shape,因此执行过程中可能会因为输入shape的变化而多次重新捕获aclgraph。
重新捕获的过程会带来额外的性能开销和Device侧资源消耗,尤其是频繁的重捕获,可能导致资源不足。
本功能提供了一个配置项,用于控制单张FX图中不同shape的重捕获次数阈值。当超过设置的阈值时,后续的所有执行将全部回退到Eager模式。
使用约束
- 本功能支持如下产品:
Atlas A3 训练系列产品/Atlas A3 推理系列产品 Atlas A2 训练系列产品/Atlas A2 推理系列产品
- 本功能仅支持reduce-overhead模式。
使用方法
该功能配置示例如下,仅供参考不支持直接拷贝运行,参数介绍参见表1。
1 2 3 4 5 6 7 8 | import torch_npu, torchair config = torchair.CompilerConfig() # 配置图执行模式 config.mode = "reduce-overhead" # 重捕获次数限制设置 config.debug.aclgraph.static_capture_size_limit = 64 npu_backend = torchair.get_npu_backend(compiler_config=config) opt_model = torch.compile(model, backend=npu_backend) |
父主题: reduce-overhead模式功能