昇腾社区首页
中文
注册
开发者
下载

新增特性

特性名称

特性描述

MindIO ACP

MindIO ACP蓝区开源

MindIO TFT

  • MindIO TFT支持MindSpore场景亚健康热切。
  • MindIO TFT蓝区开源

MindCluster ToolBox

  • 新增A3 A+X PCIe全眼图测试、HBM压测耗时和算法优化。
  • 新增310P功耗压力。
  • 新增DSA随机数算子压测。

MindCluster Ascend FaultDiag

新增A3 AI服务器故障事件。

MindCluster Ascend Deployer

MindCluster基础组件

  • 关闭算子重执行下支持灵衢L1-L2链路故障的进程级在线恢复。
  • 支持基于AIBrix vLLM部署NPU的故障实例流量隔离
  • NPU Exporter支持输出SN序列号。
  • 支持基于AIBrix vLLM服务化实例级重调度。
  • 基于AIBrix社区CRD定义,支持一键式脚本生成对应YAML,支持一键式配置和下发。
  • 基于社区原生CRD定义,支持一键式脚本生成对应YAML,支持一键式配置和下发。
  • 支持SGLang OME部署与实例级重调度
  • 支持灵衢故障上报可靠性增强
  • Volcano新增适配层,隔离不同任务控制器的差异,支持所有满足格式要求的podGroup下的亲和性调度。
  • 调度资源占用优化,未完成调度时,任务经过一定时间后重新入队
  • 公共故障支持预隔离处理级别。
  • NPU Exporter支持自定义指标
  • 支持A3推理多实例任务调度
  • 支持A3兼容A2 accelerator-type资源类型
  • 生态组件兼容验证
  • 新增推理任务守护进程参考设计
  • 支持一体机NPU故障检测与恢复
  • Volcano调度支持StatefulSet。
  • 支持MindSpore框架下的亚健康热切
  • 训练快恢易用性增强