昇腾社区首页
中文
注册
开发者
下载

业务接口变更

特性名称

接口变更

MindIO ACP

删除rename接口。

MindIO TFT

  • 修改
    • tft_init_controller:增加ZIT特性相关的enable_zit参数。
    • tft_init_processor:增加ZIT特性相关的enable_zit参数。
    • tft_notify_controller_change_strategy:增加strategy取值,增加降级训练参数params。
    • ReportState:增加训练状态枚举值RS_UCE_CORRUPTED、RS_INIT_FINISH和RS_STEP_FINISH。
  • 新增
    • tft_register_zit_upgrade_rollback_handler:训练框架向Processor注册升级回滚回调函数。
    • tft_register_zit_upgrade_repair_handler:训练框架向Processor注册升级修复回调函数。
    • tft_register_zit_upgrade_rebuild_handler:训练框架向Processor注册升级重建组回调函数。
    • tft_register_zit_downgrade_rebuild_handler:训练框架向Processor注册降级重建修复回调函数。
    • tft_set_dp_group_info:训练框架向Processor注册dp组信息。
    • tft_notify_controller_prepare_action:提供给MindCluster调用,通知MindIO TFT要执行的修复策略。

MindCluster ToolBox

ascend-dmi --dg -i signalQuality命令新增--link-type,指定测试链路类型。

MindCluster Ascend FaultDiag

  • ascend-fd parse命令新增--custom_log参数,指定自定义日志类型目录,新增--bmc_log指定bmc日志目录,新增--lcne_log指定lcne日志目录。
  • 新增ascend-fd config命令,配置自定义日志类型。

MindCluster Ascend Deployer

  • bash install.sh --install=<安装包选项>新增deepseek_pd、deepseek_cntr选项,支持安装MindIE大EP推理服务、MindIE一体机推理服务。
  • 新增多实例并行部署bash large_scale_install.sh --install=<安装包选项>。

MindCluster基础组件

  • 故障订阅接口支持订阅所有任务故障。
  • 故障订阅接口支持上报推理可自愈故障。