인프런 커뮤니티 질문&답변

하하하님의 프로필 이미지
하하하

작성한 질문수

딥러닝 CNN 완벽 가이드 - Fundamental 편

Albumentations 사용 해보기(Noise, Cutout, CLAHE, Blur, Oneof 등)

데이터 증강

작성

·

54

0

안녕하세요.

먼저 좋은 강의 감사합니다.

 

강의를 듣는 중에 궁금한 점이 몇가지 생겨 질문 남깁니다.

  1. 이미지 증강 시, 증강 기법을 너무 많이 적용해도 오히려 성능이 떨어지며, 성능을 봐가면서 기법을 선택해야하는 걸로 알고 있습니다. 근데, 어떤 기법이 적절한지 알지 못하는 상황에서 어떻게 탐색해야할까요? 하나씩 적용하고 성능을 보기에는 기법이 너무 다양해서요

  2. 배치마다 증강 기법을 적용하는 방식으로 진행중인데, 성능이 계속 이전 대비 떨어지는 현상을 보입니다. 확률을 만져줘야 하나요?(현재 0.5)

  3. 이미지 증강을 사전에 하여 학습 데이터를 늘리는 사람들도 있던데, 이 사람들은 어떤 의도로 그러시는건지 궁금합니다.

감사합니다.

답변 2

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

먼저 이미지 augmentation을 최적화하는 왕도는 없는 것 같습니다. 개인적으로 수행하는 방법으로는 가벼운 augmentation 부터 차근차근 적용하면서 점차 다양하게 적용해 보는 것입니다.

  1. 기본적으로 horizontal/vertical flip, rotation 등의 이미지 위치관련, 그리고 이미지 밝기, 대조(contrast) 조정으로 부터 시작합니다. 이 정도 수준만 적용해서 어느 정도 성능이 향상 됩니다. 기본 augmentation 이후에 다양한 augmentation을 더 적용해 볼 수 있지만, 최초 성능 향상 보다는 좀 더 덜하게 됩니다. 이후에는 crop, scale, shifting 등의 이미지 위치 관련 및 Blur 등을 적용해 볼 수 있습니다.

     

    이미지 augmentation으로 성능 향상은 일정 수준 이상 어렵습니다. 경험성 가벼운 augmentation 부터 적용해 보면서, 점점 다양한 기법을 적용하다보면 성능 향상이 일정 수준 되다가 더 이상 안되는 수준을 인식하고 해당 수준에서 멈추는 것이 일반적인 augmentation 방식입니다.

  2. 보통 augmentation 수행 시 성능이 떨어지는 경우는 특정 augmentation이 과도한 영향을 미치는 경우가 많습니다. 위에서 말씀드린 기본 augmentation외에 다른 augmentation 이 있을 시 이를 제외해보면서 최적화 해보시며 좋을 것 같습니다.

  3. 이미지 증강을 사전에 해서 학습 데이터를 늘리는 기법은 크게 활용되는 방식이 아닙니다. 아무래도 많은 이미지를 학습하는 게 더 좋기 때문에 학습 데이터를 늘리기 위해서 사용하기도 하지만, 큰 성능 향상은 어렵습니다. 다만 GAN등을 통해서 기존 이미지를 변형해서 학습 데이터를 늘리는 방식은 꾸준히 연구되고 있으며, 어느 정도 성능 향상도 있는 걸로 보고 되고 있습니다.

 

감사합니다.

하하하님의 프로필 이미지
하하하
질문자

아무리 시도해도 좋은 결과가 보이지 않아서 너무 답답했는데.. 기본부터 시작할 생각을 못해봤던것 같습니다. 다시 마음을 굳게 먹고 실험적으로 해보면서 최적의 결과 내보도록 노력해보겠습니다. 감사합니다!

0

안녕하세요, 인프런 AI 인턴입니다. 하하하님.

데이터 증강(Augmentation)은 딥러닝 모델의 일반화 성능을 향상시키는 중요한 기법이지만, 과도한 증강은 오히려 성능 저하를 초래할 수 있습니다. 질문해 주신 내용을 바탕으로 답변드리겠습니다.

  1. 적절한 증강 기법의 탐색

    • 증강 방법은 다양한 실험을 통해 데이터를 잘 이해하고, 모델 성능을 제대로 평가할 필요가 있습니다. 기법을 하나씩 적용하며 성능을 보는 것은 중요한 과정이며, 귀찮더라도 데이터를 이해할 수 있는 좋은 기회가 될 수도 있습니다. 또한, (관련 질문: 데이터 증강(Augmentation) 기법 관련 질문)에서는 불균형한 데이터의 증강 방법에 대한 토론이 있어 도움이 될 수 있습니다.
  2. 배치마다 증강 기법 적용 시 성능 저하 현상

    • 증강 기법의 확률을 조정하여(현재 0.5라면, 조금 더 낮추거나 높여서) 실험해 보실 수 있습니다. ImageDataGenerator의 변형 확률을 조절하는 다양한 방법도 함께 탐색해보세요.
  3. 사전 증강의 의도

    • 사전 증강은 원본 데이터와 증강 데이터를 미리 합쳐서 일관된 데이터를 모델에 제공할 수 있는 장점이 있습니다. 이렇게 함으로써 모델이 다양한 데이터를 사전에 접함으로써 학습의 안정성을 높일 수 있습니다. 해당 방법론에 대한 이해를 위해 데이터 증강 관련 질문을 참고해 주세요.

데이터 증강은 머신러닝에서 모델의 성능과 일반화를 위한 매우 중요한 부분으로, 실험과 검증이 필수적입니다. 각 기법의 효과가 데이터와 모델에 따라 다를 수 있으므로, 여러가지 조합을 시도하는 것이 도움이 됩니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

하하하님의 프로필 이미지
하하하

작성한 질문수

질문하기