解决的问题
Ascend-Faultdiag
问题描述 |
增加日志维测信息。 条件:必现 现象:组件命令执行失败时,部分场景维测信息不足,无法直观定界。 影响:易用性 |
|---|---|
严重级别 |
提示 |
根因分析 |
命令执行失败时,部分场景维测信息不足。 |
解决方案 |
增加维测信息。 |
修改影响 |
无其他问题影响。 |
问题描述 |
当前不指定plog,对device_log进行清洗时,会对所有文件进行清洗,而不是只清洗最新的两个文件。 条件:必现 现象:当不指定plog时,会对全量device日志清洗,可能会耗时较长,直到触发超时。 影响:易用性 |
|---|---|
严重级别 |
提示 |
根因分析 |
当不指定plog时,无法区分当前训练作业的时间区间,无法筛选出对应时间的device日志,只能全量清洗。 |
解决方案 |
优化机制,当不指定plog时,仅对时间最近的2个device日志文件进行清洗。 |
修改影响 |
无其他问题影响。 |
问题描述 |
新增NPU日志关键字,兼容24.1.RC1版本后的驱动日志打印。 条件:必现 现象:驱动24.1.RC1版本后的部分故障事件,日志关键字打印变更,需要兼容。 影响:兼容性 |
|---|---|
严重级别 |
提示 |
根因分析 |
驱动24.1.RC1版本后的部分故障事件,日志关键字打印变更。 |
解决方案 |
新增故障事件匹配规则,兼容24.1.RC1版本。 |
修改影响 |
无其他问题影响。 |
问题描述 |
ASCEND_FD_HOME_PATH环境变量可以指定/tmp目录。 条件:必现 现象:/tmp目录为所有用户可读可写,普通用户通过创建软连接和条件竞争可以实现任意文件破坏。 影响:安全性 |
|---|---|
严重级别 |
严重 |
根因分析 |
/tmp目录任意用户可读可写。 |
解决方案 |
当环境变量ASCEND_FD_HOME_PATH指定为/tmp后,在调用工具命令时增加校验,不继续执行命令。 |
修改影响 |
无其他问题影响。 |