昇腾社区首页
中文
注册

功能介绍

Rec SDK Torch涉及功能如下:

  • 模型训练基础功能
    • 支持单机单卡训练、单机多卡分布式训练。
    • 支持基于Torch开发的模型。
  • 推荐场景特有功能。

    基于Rec SDK Torch的稀疏表方案,Rec SDK Torch提供推荐的必备功能,如非亲和算子卸载,哈希映射功能等。

  • 大规模稀疏表特有功能。

    支持按照Row-wise的分布式稀疏表切分方式。

关键功能特性

Rec SDK Torch为用户提供了哈希映射、Row-wise分表、EBC查表功能、流水查表、查表融合算子。

  • 哈希映射

    Torch提供了用于稠密ID查表的nn.Embedding。但是在推荐场景,大部分ID的原始特征都是离散型,这样ID不能直接用于查表,常见的做法是需要将离散的ID转为表的行号。为此Rec SDK Torch提供了哈希映射功能,用于将原始的离散ID映射到Embedding,不需要用户提前做ID转换。

  • EBC查表

    对标原生Torch的nn.EmbeddingBag功能,对指定的多个IDs,在查表时进行求和或者取平均的Pooling操作。

  • Row-wise分表

    在将Embedding切分到不同表时,按行对Embedding进行分表,使用取余分桶策略,按照ID取余的余数确定Embedding在表上的位置。

  • 流水查表

    Rec SDK Torch查表任务由通讯、CPU、NPU计算等多个子任务构成。Rec SDK Torch提供了流水查表方法让子任务之间可以并行以充分发挥硬件算力。

  • 查表融合算子

    Rec SDK Torch提供了梯度计算和优化器融合的查表算子以优化查表性能。