此环境变量用于控制开启task_queue算子下发队列优化的等级。
Level 1优化:使能task_queue算子下发队列优化,将算子下发任务分为两段,一部分放在新增的二级流水上,一、二级流水通过队列传递任务,相互并行,通过部分掩盖减少整体的下发耗时,提升端到端性能。
Level 2优化:包含Level 1的优化并增加了一、二级流水负载均衡和二级流水唤醒加速优化。仅在二进制场景生效,建议配置值为Level 2优化。
此环境变量默认配置为1。
ASCEND_LAUNCH_BLOCKING设置为“1”时,task_queue算子队列关闭,TASK_QUEUE_ENABLE设置不生效。
export TASK_QUEUE_ENABLE=2
环境变量仅适用于PyTorch网络的场景。
Atlas 训练系列产品
Atlas A2 训练系列产品
Atlas 800I A2推理产品