昇腾社区首页
中文
注册

标签褶皱数据增强工具

增强工具路径“./dataset_tools/tag_wrinkle_augmentation/tag_paste_data_augmentation.py”,脚本支持输入标签的图片文件夹路径,配置相应参数,输出增强后的图片路径,根据参数的配置来生成褶皱、起翘增强图片。

生成模拟图片需要手动配置参数,通过修改参数可以改变生成的褶皱、气泡特征的真实程度,建议使用默认自动生成参数,参考如下。

表1 建议配置参数

参数名称

褶皱特征建议值

气泡特征建议值

area_ratio

[0.0001, 0.01]

[0.005, 0.02]

aspect_ratio

[0.025,0.2]

[0.33,3.0]

rotation

[-90,90]

[-90,90]

up_ratio

[1.5,3.5]

[1.1,1.3]

down_ratio

[0.5,0.8]

[0.5,0.8]

area_ratio_thres

0.01

0.02

same_ratio_enable

False

True

默认参数示例如下(生成褶皱):

python3 ./dataset_tools/tag_wrinkle_augmentation/tag_paste_data_augmentation.py --input_dataset_path=/data/small --output_dataset_path=/data/output

手动参数示例如下:

python3 ./dataset_tools/tag_wrinkle_augmentation/tag_paste_data_augmentation.py --input_dataset_path=/img/path --output_dataset_path=/data/output --area_ratio=[0.0001,0.01] --aspect_ratio=[0.025,0.2] --rotation=[-90,90] --up_ratio=[1.5,3.5] --down_ratio=[0.5,0.8] --area_ratio_thres=0.01 --same_ratio_enable=false --each_type_generate_nums=1

生成文件夹下会创建目录,存放用户自定义参数生成图片数据,参数如表2所示。

如果有多种标签,多类型特征需求时,需要手动配置脚本参数分别生成。

表2 数据集增强工具执行参数信息

参数名

类型

取值范围

默认值

说明

--input_dataset_path

str

-

必选

输入标签图片文件夹路径。

--output_dataset_path

str

-

必选

输出图片文件夹路径(不可以与输入相同路径)。

脚本会在“output_dataset_path”目录下新建“images”“annotations”文件夹,并将生成的图片数据放在“images”中,将已标注的数据按imagenet形式放在“annotations”文件夹中。

--each_type_generate_nums

int

大于0

1

设置分别生成褶皱或气泡数据图片张数。

--area_ratio

list

[0.0001, 0.02]

[0.0001, 0.01]

单个缺陷面积比例范围。

--aspect_ratio

list

[0.005, 3.0]

[0.025, 0.2]

单个缺陷长宽比范。

--rotation

list

[-90, 90]

[-90, 90]

单个缺陷旋转角度范围。

--up_ratio

list

[1.0, 3.5]

[1.5, 3.5]

上半部分亮度变换比例范围。

--down_ratio

list

[0.5, 1.0]

[0.5, 0.8]

下半部分亮度变换比例范围。

--area_ratio_thres

float

大于0,小于1

0.01

总缺陷面积比例阈值,建议 [0.005, 0.02]。

--same_ratio_enable

bool

true、false

false

下半部分同步上半部分。

--timeout

int

-

300

默认5分钟超时。