昇腾社区首页
中文
注册

注意事项

风险提示

训练组件只提供模型训练能力,用户如需对数据集进行保密处理,则应从整个解决方案角度考虑数据的安全。

建议使用非root用户执行

  • 使用root用户权限执行程序的存在安全风险且不可控,建议使用非root用户执行脚本。
  • sudo组普通用户执行脚本时不建议使用sudo+“command”方式。
  • 需要保证依赖的芯片库、ACL库、输入指定的数据集,用户具有“读”权限。
  • 需手动设置同一时间最多可打开的文件数为“65535”,设置命令参考如下。
    ulimit -n 65535

设置umask

建议用户将系统中的“umask”设置为“027”及其以上,提高文件权限。

以设置“umask”“027”为例,具体操作如下所示。

  1. 以root用户登录服务器,编辑“/etc/profile”文件。
    vim /etc/profile
  2. “/etc/profile”文件末尾加上umask 027,保存并退出。
  3. 执行如下命令使配置生效。
    source /etc/profile

程序入口

各功能入口执行脚本请参见对应章节介绍,其余脚本均非功能执行入口。

训练数据集要求

由于需要将训练数据集拆解成训练集和测试集,实现边训边验,其中用于训练的数据集图片数量需要大于10。

超参设置建议

  • 深度学习模型的学习率设置。

    一般在(0, 1)之间,建议不超过此范围。

  • 模型的输入宽高设置。

    一般大于0,且为2的倍数,具体每个模型的要求略有不同。

  • 置信度阈值,NMS阈值,IOU阈值设置。

    一般在[0, 1]之间,建议不超过此范围。

  • 训练轮数“epoch_size”设置。

    一般在[1, 500]之内,建议不超过此范围。

batch_size及模型尺寸设置

  1. 训练数据集中训练集与测试集比例为4:1,需要保证训练数据集总量的五分之一大于“batch_size”设置值。
  2. 由于NPU及CPU内存空间有限,“batch_size”及模型输入宽高不能设置太大,若出现“[MallocDynamicMem] Out of memory!!!”,则可相应降低两者的值。

若出现提示“Error: Tensor data_vsel_ub_fp32_appiles buffer size(327688) more than available buffer size(309768)”,为超出算子ub内存限制,则需要降低模型输入宽高。