작성
·
198
0
영상 05:06초에 feature map을 통해 만들어진 2000개 벡터 중투영된 사이즈가 6*6에 채널이 256개면 벡터 하나당 6*6*256개이고 SPP Layer을 통해 FC로 입력되는 총 벡터의 길이는 하나의 벡터 길이(w*h*256)의 2000개 합이라고 이해하면 맞는 것인가요?
답변 1
0
안녕하십니까,
SPPNet은 Feature map의 크기 w*h 에 관계없이 고정된 vector 크기를 반환합니다.
1분면 + 4분면 + 16분면 = 21개 분면에 대해서 특징값을 뽑아냅니다. 대표적으로 max pooling으로 한다면 각 분면에서 1개의 max pooling 값을 가지게 됩니다. 만일 max pooling이고 feature map 차원수가 256 이라면 21(분면수)x 256(차원수)x 2000(selective search 후보 갯수)로 만들어 집니다.
감사합니다.