昇腾社区首页
中文
注册

HCCL_OP_EXPANSION_MODE

功能描述

此环境变量用于配置通信算法的编排展开位置。

配置示例

export HCCL_OP_EXPANSION_MODE="AI_CPU"
  • "AI_CPU" 代表通信算法的编排展开位置在Device侧。

默认值为“”,代表通信算法的编排展开位置在Host侧。

是否必选

使用约束

  • 当前该配置仅对Atlas 300I Duo 推理卡单卡场景生效。
  • AI CPU展开不支持profiling(可在硬件区查看),不支持task exception。
  • 不支持静态图的AI CPU展开,静态图(包括unknow shape)保持原有下沉执行。
  • AI CPU展开仅支持SDMA拷贝,不支持RDMA。
  • 规约类型仅支持inlinereduce,若是TBE reduce则不进行AI CPU展开。

支持的型号

Atlas 推理系列产品