인프런 커뮤니티 질문&답변

윤도현님의 프로필 이미지
윤도현

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Data Augmentation 관련

작성

·

1.1K

0

안녕하세요 선생님 

항상 좋은강의 잘 듣고있습니다. 

대학원생활에 정말 많은 도움 받고 있어요 ㅎㅎ 

수업을 듣던 중 궁금한점이 생겨서 질문 남깁니다. 

 

Q1. Config의 이해 - Data Pipeline 수업을 듣고 적용해보던 중  default로 적용되어있는 Augmentation기법들(Resize, RandomFlip, Normalize, Pad) 말고 mmdetection에서 제공하는 다른 transform 함수를 적용해보려 합니다. 

https://mmdetection.readthedocs.io/en/latest/_modules/mmdet/datasets/pipelines/transforms.html

위 주소에 나온  Cutout, Mosaic, Mixup를 적용하고 싶은데 아래 사진과 같이 coco_instance.py 파일에 저렇게 추가하면 적용될까요? 

 

Q2. data augmentation을 적용했을 때 데이터가 얼만큼 늘어나는지 어떻게 아나요? 

제 데이터가 
train:80장 

val:20장 

이렇게 구성되어있는데 얼만큼 늘어나는지(ex, augmentation적용 후 300장) 궁금합니다! 

 

답변 3

0

mmdet의 yolox_s, yolox_tiny config를 확인하면 Mosaic, MixUp 적용 예시를 확인할 수 있습니다. 필요한 분들 참고하시면 좋을 듯합니다.

0

윤도현님의 프로필 이미지
윤도현
질문자

안녕하세요 업데이트가 늦었습니다.. ㅎㅎ

Data Augmentation에 Mosaic을 적용하기 위해서는 train_dataset 파이프라인에

MultiImageMixDataset을 같이 사용 해야 합니다. 

방법은 아래와 같습니다. 

# Open configs/faster_rcnn/faster_rcnn_r50_fpn_1x_coco.py directly and add the following fields
data_root = 'data/coco/'
dataset_type = 'CocoDataset'
img_scale=(1333, 800)​
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)

train_pipeline = [
    dict(type='Mosaic', img_scale=img_scale, pad_val=114.0),
    dict(
        type='RandomAffine',
        scaling_ratio_range=(0.1, 2),
        border=(-img_scale[0] // 2, -img_scale[1] // 2)), # The image will be enlarged by 4 times after Mosaic processing,so we use affine transformation to restore the image size.
    dict(type='RandomFlip', flip_ratio=0.5),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size_divisor=32),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels'])
]

train_dataset = dict(
    _delete_ = True, # remove unnecessary Settings
    type='MultiImageMixDataset',
    dataset=dict(
        type=dataset_type,
        ann_file=data_root + 'annotations/instances_train2017.json',
        img_prefix=data_root + 'train2017/',
        pipeline=[
            dict(type='LoadImageFromFile'),
            dict(type='LoadAnnotations', with_bbox=True)
        ],
        filter_empty_gt=False,
    ),
    pipeline=train_pipeline
    )
​
data = dict(
    train=train_dataset
    )

 

감사합니다.

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

오, mmdetection이 Mosaic과 MixUp이 되는 군요. 저도 모르고 있었습니다. 

MixUp은 type='Mixup' 아닐까 싶습니다. 

아래 URL도 참조해 보시지요.  

https://cake.tistory.com/38?category=498558

수행해 보시고 결과도 update 부탁드립니다. 

윤도현님의 프로필 이미지
윤도현

작성한 질문수

질문하기