功能描述
此环境变量用于配置通信算法的编排展开位置。
配置示例
export HCCL_OP_EXPANSION_MODE="AI_CPU"
- "AI_CPU" 代表通信算法的编排展开位置在Device侧。
默认值为“”,代表通信算法的编排展开位置在Host侧。
使用约束
- 当前该配置仅对Atlas 300I Duo 推理卡单卡场景生效。
- AI CPU展开不支持profiling(可在硬件区查看),不支持task exception。
- 不支持静态图的AI CPU展开,静态图(包括unknow shape)保持原有下沉执行。
- AI CPU展开仅支持SDMA拷贝,不支持RDMA。
- 规约类型仅支持inlinereduce,若是TBE reduce则不进行AI CPU展开。