TF Adapter简介

TF Adapter为加速TensorFlow图在昇腾AI处理器上执行的TensorFlow插件，主要目的是将TensorFlow图转换为昇腾AI处理器上可以执行的图。

TF Adapter在昇腾AI软件栈中的位置如下图所示。

图1 昇腾AI软件栈架构图

下面描述TF Adapter的主要功能。

用户Python接口

【接口简介】

TF Adapter提供了适配TensorFlow框架的用户Python接口，用户可以基于TensorFlow框架进行训练脚本开发。主要包括：

扩展Estimator API，提供在昇腾AI处理器上进行高效训练的易用API。
提供session策略、子图下沉、预处理下沉等配置项。
提供资源初始化相关API。
提供分布式训练API，例如npu_distributed_optimizer_wrapper，提供简便的基于RING-ALLREDUCE的数据并行分布式训练架构接口。

详细接口介绍请参考TF Adapter API。

【获取路径】

“tfplugin安装目录/tfplugin/latest/python/site-packages/npu_bridge”。

【头文件引用】

使用接口前，可以新增以下头文件引用，用于导入NPU相关库。

      
           from npu_bridge.npu_init import *

引入上述头文件后，训练脚本默认在昇腾AI处理器执行。

然后直接使用相关接口：

      
           mnist_classifier=NPUEstimator(
  model_fn=cnn_model_fn,
  config=npu_config,
  model_dir="/tmp/mnist_convert_model"
  )

也可以通过如下方式导入：

      
           from npu_bridge.estimator.npu.npu_estimator import NPUEstimator

子图拆分优化器

TF Adapter在TensorFlow图执行器扩展子图拆分优化器。子图拆分优化器在TensorFlow图构建、图拆分、图优化后执行，作用是识别可下沉到Device执行的节点，对可下沉节点进行边收缩，使连续的可下沉的节点变为一副子图，并在原图上添加一个持有该子图的GEOP算子。GEOP算子为TF Adapter扩展的TensorFlow算子，在TensoFlow Runtime中运行，作用是将标识的子图下沉到Device执行。

图2 子图拆分示意图

全下沉与混合计算

昇腾AI处理器默认采用计算全下沉模式，即所有的计算类算子全部下沉到Device侧执行，从而利用昇腾AI处理器进行加速。针对在计算图中有不支持的算子的场景（例如py_func），为提供灵活性和扩展性，提供混合计算模式，将不支持在Device侧执行的算子留在Host由前端框架执行。

TF Adapter识别资源类算子，在混合计算场景下不下沉，另外可通过NPU算子支持清单“opp/built-in/framework/tensorflow/npu_supported_ops.json”识别哪些算子可下沉到昇腾AI处理器。文件示例：

  "Abs": {
    "isGray": false,
    "isHeavy": false
  },

出现在json文件中的算子，在全下沉模式下都会下沉；
isGray为true的算子，在混合计算模式下不下沉，当前版本isGray全部为false，即混合计算模式下做下沉处理；
isHeavy表示性能敏感的计算密集型算子，当该算子在Shape推导时为unknow时，TF Adapter会拦截子图下沉。

除此之外，混合计算场景下，用户还可通过接口自行指定不下沉的算子，更多介绍请参考混合计算。

父主题： 入门学习