部分算子会在框架层引入非连续转连续操作,导致host侧会有额外开销,大量转连续操作导致host下发算子间隔拉长,造成device执行断流水,在profiling数据上表现为device执行出现free time。
有部分算子因数据存储格式要求引入非连续转连续操作。
参考算子优化章节非连续转连续(Vector算子)