인프런 영문 브랜드 로고
인프런 영문 브랜드 로고
채널톡 아이콘

인프런 커뮤니티 질문&답변

Eunsu Seo님의 프로필 이미지

작성한 질문수 1

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

YOLOv3에서 전체 예측 결과 갯수 10,647 구할 때 3을 곱해 주는 이유가 궁금합니다.

작성

·

48

0

각 freture map 의 이미지 조각 갯수를 더하고 여기에 마지막에 3을 곱해주는데 여기에 대해서 좀 더 설명 부탁 드립니다.

답변 2

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까

제가 주말에 지방에 내려오느라 답변이 늦었습니다

아래 인프런 AI 가 답변한대로 feature map grid 상에 세개의 anchor box 들이 있기에 3을 곱해줍니다

감사합니다

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. Eunsu Seo님의 질문에 답변 드리겠습니다.

YOLOv3와 같은 객체 탐지 모델에서 여러 개의 feature map을 사용할 때, 각 feature map은 여러 scale에서 객체를 탐지하기 위해 역할을 수행합니다. YOLOv3는 다양한 크기의 객체를 탐지하기 위해 3개의 different scale에서 예측을 수행합니다. 따라서 각 feature map이 담당하는 영역은 다음과 같이 구분됩니다:

  1. 큰 객체를 탐지하기 위한 큰 scale의 feature map
  2. 중간 크기의 객체를 탐지하기 위한 중간 scale의 feature map
  3. 작은 객체를 탐지하기 위한 작은 scale의 feature map

각 feature map의 크기는 이미지가 여러 grid로 나뉘어져서 생긴다. YOLOv3는 각 grid cell마다 여러 anchor box를 통해 예측을 수행하며, 여기에서 각 scale마다 3개의 anchor box를 사용합니다. 이 때문에 각 feature map의 이미지 조각 수에 3을 곱하게 되며, 이는 각 grid cell당 anchor box의 수를 의미합니다.

이러한 방식으로, 각 feature map이 3개의 anchor box를 사용하여 예측을 수행함에 따라 총 3개의 scale들로부터 각 각 feature map의 예측이 종합되어 YOLOv3의 최종 예측 결과가 도출됩니다.

추가적으로 궁금한 점이 있으시면, 강의 내 관련된 유사한 질문과 답변 추적을 통해 더 심도 있는 정보를 얻으실 수 있습니다. 지금은 다음의 유사한 질문을 참고해 보시길 추천드립니다:
- YOLO-V3 모델에서 Feature Map과 이미지 사이즈 관계 질문입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.