작성
·
345
0
RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?
만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?
답변 4
0
아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?
=> 네, 맞습니다.
그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?
=> 네 맞습니다.
그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ
=> 16이 강의에 몇분 몇초에 나오는 건지 말씀해 주십시요
0
그리고 16이라는 숫자는 어디서 튀어나온건가요? ㅜㅜ
결국 VGG든 뭐든 사용해서 나온 피쳐맵의 가로x세로x앵커박스의 수 가 전체 앵커박스의 수 아닌가요?
0
아하 어찌보면 anchor box를 통해 초기값세팅(?)을 한다고 생각하면 될까요?
그리고 RPN에서 classification 을 담담하는 부분은 18개의 채널로 이루어져 있는데, 여기에는 9개의 앵커박스(에 해당하는 물체)가 존재할 확률/존재하지 않을 확률이 들어가는 건가요?
0
안녕하십니까,
RPN을 이용하면 픽셀단위가 아니라 feature 맵의 한 점(?) 을 중심으로 9개의 앵커박스가 형성되고, 그 앵커박스에 object이 있는지 detection 하는건가요?
=> 네 맞습니다.
만약 그렇다면 이미 9개으 앵커박스는 모양과 크기가 정해져있고, 중심도 정해져있으니 bb box regression 이 필요한가요?
=> RPN에서 Ground Truth와 가장 근접한 anchor box(Ground truth와 겹치는 IOU가 0.7 이상인)를 계속 학습 하면서 해당 영역에, 즉 anchor box별로 object가 있는지, 있다면 거리 차이는 얼마나 되는지를 학습하기 위해서 bounding box regression을 수행합니다.
감사합니다.
800x600 이미지가 16으로 나누어져 scale down 된다고 하셨는데,
피쳐맵의 h 와 w 이 어떻게 16으로 나누어져 구해지는 건가요?