인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

장태훈님의 프로필 이미지

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

YOLO 학습

작성

·

85

·

수정됨

0

안녕하세요 강사님

최근에 YOLO를 이용해 이것 저것 연습을 하는데 궁금한 점이 있습니다.

데이터셋의 크기가 너무 커서(2TB) 일단 필요한 부분만 선택해서 학습을 했습니다. 그런데 이렇게 하면 새로운 데이터셋을 추가해서 학습을 시키려면 <기존 1TB + 새로운 데이터셋> 이렇게 합친 데이터셋을 다시 학습을 해야 하나요...?
예를 들어 a, b, c, d를 탐지할 수 있게 학습을 하고 추가적으로 ㄱ, ㄴ, ㄷ, ㄹ도 탐지할 수 있게 데이터를 추가해서 총 a, b, c, d, ㄱ, ㄴ, ㄷ, ㄹ을 모두 탐지할 수 있도록...

마지막 출력 계층만 새롭게 학습을 하는 방법은 기존 데이터셋에 대한 성능이 떨어질 수 있어 좋은 선택은 아닌가요...?

답변 2

1

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

기존 데이터 세트가 있고, 여기에 Detect 하려는 오브젝트가 있는데, 추가적인 다른 Object도 Detect하려면 기존 데이터 세트와 새로운 Object를 가지는 데이터 세트를 모두 학습해야 합니다.

그러니까, 새로운 데이터셋을 추가해서 학습을 시키려면 <기존 1TB + 새로운 데이터셋> 이렇게 합친 데이터셋을 다시 학습을 해야합니다(a, b, c, d를 탐지할 수 있게 학습을 하고 추가적으로 ㄱ, ㄴ, ㄷ, ㄹ도 탐지할 수 있게 데이터를 추가해서 총 a, b, c, d, ㄱ, ㄴ, ㄷ, ㄹ을 모두 탐지 하려면)

데이터가 너무 커서 학습이 느리다면 전체 2TB에서 10%인 200GB만 학습하고 성능을 모니터링 해보시면 어떨까 싶습니다. 근데 2TB면 매우 큰 데이터 세트인데, 만약에 이미지 사이즈가 커서 한장에 수십 MB라 그렇다면 이미지 사이즈를 어느정도 줄이거나 이미지 압축을 다른 방식으로 적용해서 저장 용량을 줄인 상태에서 학습을 수행해 보시면 어떨까 싶습니다.

그리고 마지막 출력 계층만 새롭게 학습을 하는 방법은 기존 데이터셋에 대한 성능이 떨어질 수 있어서 좋은 선택은 아닙니다.

 

감사합니다.

 

장태훈님의 프로필 이미지
장태훈
질문자

감사합니다!
데이터셋 크기에 대해서 어떻게 하면 줄일 수 있지, 새로운 데이터셋에 대해서도 가능한 지에 대해서만 고민하고 있었는데 이미지 사이즈를 줄이는 방법은 생각하지 못 하고 있었습니다..!

확인해 보니 모든 사진이 3024 × 4032, 4032 × 3024, 4248 × 5664 정도의 고해상도 사진이었습니다...ㅎㅎ

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. 장태훈님.

YOLO 모델의 학습과 관련된 데이터셋 관리에 대해 질문 주셨군요. 상황을 고려할 때, 큰 데이터셋을 다룰 때의 몇 가지 접근 방안을 안내드리겠습니다.

  1. 추가 학습 방법: 새로운 데이터를 추가하여 다시 학습하는 경우, 기존 데이터셋과 결합하여 학습을 하게 되면 모델이 이전 클래스에 대한 성능을 유지하면서 새로운 클래스에 대한 학습도 가능합니다. 만약 전체 데이터를 사용할 수 없는 상황이라면, 데이터 중 일부를 샘플링하여 사용하는 추가 학습 방법을 고려할 수 있습니다.

  2. 전이 학습 사용: 만약 데이터가 너무 커서 모든 데이터를 한 번에 다루기 어렵다면, 전이 학습을 활용해볼 수 있습니다. 기본적으로 네트워크의 상위 계층을 고정시키고 마지막 출력 계층만 다시 학습하는 방식을 선택할 수도 있습니다. 다만, 이 방법은 기존 데이터셋에 대한 성능이 떨어질 위험이 있습니다. 따라서 새로 학습할 클래스를 잘 구성하여 균형 있는 데이터셋을 사용하는 것이 중요합니다.

기존에 유사한 질문들이 있습니다. 질문1: YOLO 학습 관련, 질문2: YOLO와 전이 학습에서 추가적인 정보를 얻으실 수 있습니다. 또한, YOLO의 전이 학습 및 데이터 관리에 대한 구체적인 설명은 권 철민님의 답변에서 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.