해결된 질문
작성
·
272
0
단어를 어떻게 말씀드려야 할지 모르겠어서 이중 객체 검출이라는 용어를 사용했습니다.
앞 선 질문에서 "몸 전체에 대한 레이블링과 얼굴 부분에 대한 레이블링, 총 2가지 레이블링" 이라고 하신 부분에 이어 질문이 있습니다.
예시를 들어 자동차의 번호판 같은 것을 검출하고 싶을 때 입니다. 바로 번호판을 Annotation 작업을 해서 수행하면 상가 간판, 도로 표지판 등 네모난 물체에 글씨가 적혀있는 부분까지 오인 검출이 됩니다. 따라서 자동차를 먼저 검출하고 자동차 번호판은 자동차에만 있으니 이어서 번호판을 검출하도록 알고리즘을 작성하면 효율성이 올라갈 것 같아서 해보려고 합니다.
이렇게 이중으로 검출을 하고 싶다면 알고리즘을 어떻게 작성할지 큰 틀이 궁금해서 질문 드립니다. 직접Annotation 작업을 한다면 어떻게 해야 하는지, 그리고 올려주신 YOLO V5를 사용한다고 한다면 어떻게 이중으로 검출하라고 알고리즘을 구성할지 궁금합니다.
추가 질문으로는 객체 검출 알고리즘(YOLO 등)의 가중치가 Pre-training 된 것을 사용하는 부분입니다.
제가 이해한 학습이란 객체 검출 알고리즘을 사용하려고 하는 데이터에 대해 훈련을 시키면 가중치가 업데이트 되며 학습이 되는 것 입니다. 근데 Pre-training된 것을 사용하는 것에 어떤 의미가 있는지 궁금합니다.
강의 재미있게 수강하고 있습니다. 감사합니다!
답변 1
0
안녕하십니까,
좋은 아이디어군요. 다만 이게 실현 가능성은 어려워 보입니다. 저도 흥미가 생겨서 여러가지 검색을 해보았는데, 적절한 방법은 찾지 못했습니다.
머신러닝/딥러닝 모두 클래스를 분별하는 방식은 exclusivie하게 특정 클래스별로 판단하는 방식입니다. softmax 함수등을 최종 classification layer에 적용하는 것도 10개의 클래스가 있으면 이중 가장 큰 확률을 가지는 클래스를 결정하도록 유도하기 위함입니다. 특정 카테고리 클래스를 먼저 찾고, 다음에 해당 카테고리 클래스를 세분화 해서 찾는 방식 모델은 아직까지 없는 걸로 보입니다(물론 제가 지식이 짧아서 못찾았을 수도 있습니다만 ^^;;)
만약에 번호판 예측 확률이 떨어진다면, 보다 많은 번호판 이미지를 추가해서 학습해 볼것을 권장 드립니다. 성능이 안나오면 제일 첫번째 적용할 방법은 학습 이미지를 증가하는 것입니다.
두번째 pretrained 가중치를 사용하는 이유는...
딥러닝이 말씀하신 대로 모델의 가중치를 학습하면서 최적화하는 방식이지만, 초기 가중치를 random한 값으로 하는 것 보다 기존에 성능이 좋은 , 또는 다양한 이미지나 오브젝트들을 학습한 모델의 가중치를 초기 가중치라 적용하면 성능이 훨씬 좋아집니다.
그래서 대부분의 모델들이 coco dataset들으로 학습이 된 모델의 가중치를 초기 가중치로 자신의 모델로 설정하고 학습을 하는 방식을 택합니다.
감사합니다.