开发者
资源

解决的问题

Ascend-Faultdiag

问题描述

增加日志维测信息。

条件必现

现象组件命令执行失败时,部分场景维测信息不足,无法直观定界。

影响易用性

严重级别

提示

根因分析

命令执行失败时,部分场景维测信息不足。

解决方案

增加维测信息。

修改影响

无其他问题影响。

问题描述

当前不指定plog,对device_log进行清洗时,会对所有文件进行清洗,而不是只清洗最新的两个文件。

条件必现

现象当不指定plog时,会对全量device日志清洗,可能会耗时较长,直到触发超时。

影响易用性

严重级别

提示

根因分析

当不指定plog时,无法区分当前训练作业的时间区间,无法筛选出对应时间的device日志,只能全量清洗。

解决方案

优化机制,当不指定plog时,仅对时间最近的2个device日志文件进行清洗。

修改影响

无其他问题影响。

问题描述

新增NPU日志关键字,兼容24.1.RC1版本后的驱动日志打印。

条件必现

现象驱动24.1.RC1版本后的部分故障事件,日志关键字打印变更,需要兼容。

影响兼容性

严重级别

提示

根因分析

驱动24.1.RC1版本后的部分故障事件,日志关键字打印变更。

解决方案

新增故障事件匹配规则,兼容24.1.RC1版本。

修改影响

无其他问题影响。

问题描述

ASCEND_FD_HOME_PATH环境变量可以指定/tmp目录。

条件必现

现象/tmp目录为所有用户可读可写,普通用户通过创建软连接和条件竞争可以实现任意文件破坏。

影响安全性

严重级别

严重

根因分析

/tmp目录任意用户可读可写。

解决方案

当环境变量ASCEND_FD_HOME_PATH指定为/tmp后,在调用工具命令时增加校验,不继续执行命令。

修改影响

无其他问题影响。