SPP 원리에 대해서 궁금증이 남습니다

Question

안녕하세요. SPPNet의 이해 01 - RCNN의 문제점 강의에서 질문이 있습니다

1. selective search 이미지를 Feature map에 매핑을 한다는 것이 CNN으로 추출된 필터값에서 selective search 이미지 영역의 특징 값을 뽑아낸다는 말인가요?

2. 그런데 이 부분에서 별도 추출? 이것은 어떤 뜻인가요? CNN을 통과한 Feature map은 가령 13x13으로 나오는데, 이게 selective search랑 매핑하면서 다른 Feature map으로 만들어서 사이즈가 달라지는 것인가요? 그래서 Flatten되지 않는 것인가요?

정확한 핵심을 계속 강의를 봐도 이해가 되지 않네요. 감사합니다

권 철민 · Answer

안녕하십니까,

sppnet은 selective search를 feature map에 투영시켜서 얻은 feature map 영역을 기반으로 Detection을 합니다. 가령 2개의 selective search 영역 35 x 64와 70x128 영역이 있다면 이를 feature map에 투영해서 selective search에 투영된 feature map 영역을 얻습니다. 그런데 이 두개의 selective search 영역이 투영된 feature map은 서로 크기가 다릅니다. 가령 하나는 4x6, 다른 하나는 8x10 이 된다고 가정해 보겠습니다. 결국은 이들 feature map들을 마지막 FC(Dense) layer에 붙여야 하는데 서로 다른 feature map이라 FC layer의 input 크기를 정할 수가 업습니다.

그렇기 때문에 SPP를 이용하여 크기가 동일한 vector로 변환을 하는 것입니다.

감사합니다.

유영재 · Answer

투영을 시킨다고 하면, selective search에서는 비율대로 축소해서 feature map 좌표를 맞춰서 자르는 것인가요?

인프런 커뮤니티 질문&답변

SPP 원리에 대해서 궁금증이 남습니다