인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

Alex's profile image
Alex

asked

Deep Learning CNN Complete Guide - Fundamental Edition

Understanding Data Augmentation

Augmentation원본에 적용해서 데이터 갯수 자체를 늘리는 행위는 의미가있나요?

Written on

·

11

0

지금은 훈련시에 원본 데이터의 형태가 변형되어 train 이미지의 갯수는 변형되지 않는데 애초에 train 이미지에 data augmentation 을적용하여 갯수 자체를 늘려서 학습시키는 건 좋지 않은가요?

머신러닝딥러닝kerastensorflowkagglecnn

Answer 2

0

권 철민님의 프로필 이미지
권 철민
Instructor

안녕하십니까,

경험적으로 해당 방법은 train시에 augmentation을 적용하는 것 대비 성능 향상이 거의 이뤄지지 않는데, 제가 생각하는 이유는 아래와 같습니다.

  1. train 시에 epoch등을 늘리는 것과 큰 차이가 없음.

  2. 미리 augmentation 되어 있는 데이터에 대해서 train 시에 augmentation을 적용하면서 중복 augmentation이 되고, 원본 이미지가 적당한 수준에서의 augmentation이 적용되는게 아니라 지나친 수준으로 augmentation이 되면서 성능이 저하될 우려가 있음.

감사합니다.

0

안녕하세요, 인프런 AI 인턴입니다. Alex님.

데이터 어그멘테이션은 모델의 학습을 돕기 위해 여러 방식으로 이미지를 변형하여 데이터의 다양성을 높이는 과정입니다. Alex님께서 질문하신 원본 데이터에 어그멘테이션을 적용하여 데이터 수 자체를 늘리는 방법은, 데이터의 다양성이 늘어남에 따라 모델이 가능한 다양한 상황을 학습할 수 있도록 하여 일반화 성능을 향상시킬 수 있습니다. 하지만, 몇 가지 고려해야 할 사항이 있습니다.

  1. 데이터 셋의 다양성 증가: 데이터 자체를 늘리는 것은 일반화 능력을 높일 수 있으나, 필요한 경우 실제 데이터 분포를 너무 왜곡하지 않도록 주의해야 합니다.

  2. 오버피팅 방지: 어그멘테이션을 통해 데이터의 수를 늘림으로 인해, 모델이 특정 데이터 특징에 과적합되지 않도록 할 수 있습니다.

  3. 모델 성능의 향상 측면: 유사 질문 - 데이터 증강의 중요성과 적용 시 주의할 점에서도 설명되었듯이, 많은 데이터가 있을 경우에도 Augmentation은 권장됩니다. 이는 다양한 상황에서의 모델의 견고함을 확보하기 위함입니다.

  4. 컴퓨팅 자원의 효율성: 어그멘테이션을 통해 데이터 수를 증가시키면, 이를 저장하고 관리, 또 학습하는 데 필요한 자원이 증가할 수 있습니다. 따라서 데이터의 실제 필요성에 맞춰 조절이 필요합니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

Alex's profile image
Alex

asked

Ask a question