昇腾社区首页
中文
注册
开发者
下载

通信库

  • 功能增强:
    • AICPU展开场景下集合通信算子按序下发,解决aicpu核抢占导致的通信卡住问题;
    • AIV展开模式下支持配置算子使用的最大AIVector核数,解决多算子并发时的核抢占问题;
    • Atlas A3系列产品上支持在SuperKernel中AllReduce、ReduceScatter算子的确定性通信算法;
    • Atlas A2系列产品上AllReduce、ReduceScatter支持图模式AIV展开时的确定性计算;
  • 性能优化:
    • Atlas A3系列产品上AICPU展开模式支持缓存通信task,优化小数据量场景下的kernel执行时间;
    • Atlas A3系列产品上ReduceScatter、Allgather算子新增支持pipeline算法,该算法可以用于提升跨超节点大数据量场景下的通信性能
    • Atlas A2系列产品上AllReduce、ReduceScatter在确定性场景下性能提升。通过减少确定性计算小数据量通信场景下的任务数量,减少下发耗时;
  • 维测能力增强:
    • 关键处理的ERROR/Entry等日志优化,Error Message打印优化,内存不足等场景的报错优化