Kernel内多流水异步并行 昇腾芯片核内采用异步多流水线设计,主要包含以下几类指令流水线: 标量执行单元,负责标量计算和程序控制流等,也负责发射异步DSA指令 CUBE执行单元 Vector执行单元 MTE执行单元 图1 多流水异步执行示意图 父主题: 并行模型