앵커박스

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Faster RCNN의 이해 01 - Anchor Box

작성

349

RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?

만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?

tensorflow 컴퓨터 비전 python 머신러닝 배워볼래요? 딥러닝 keras

답변 4

권 철민

지식공유자

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?

=> 네, 맞습니다.

그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?

=> 네 맞습니다.

그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ

=> 16이 강의에 몇분 몇초에 나오는 건지 말씀해 주십시요

JACKIE CHAN

질문자

800x600 이미지가 16으로 나누어져 scale down 된다고 하셨는데,

피쳐맵의 h 와 w 이 어떻게 16으로 나누어져 구해지는 건가요?

JACKIE CHAN

질문자

그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ

결국 VGG든 뭐든 사용해서 나온 피쳐맵의 가로x세로x앵커박스의 수 가 전체 앵커박스의 수 아닌가요?

JACKIE CHAN

질문자

아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?

권 철민

지식공유자

안녕하십니까,

RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?

=> 네 맞습니다.

만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?

=> RPN에서 Ground Truth와 가장 근접한 anchor box(Ground truth와 겹치는 IOU가 0.7 이상인)를 계속 학습 하면서 해당 영역에, 즉 anchor box별로 object가 있는지, 있다면 거리 차이는 얼마나 되는지를 학습하기 위해서 bounding box regression을 수행합니다.

감사합니다.

인프런 커뮤니티 질문&답변

앵커박스