인프런 커뮤니티 질문&답변

돌머리 님의 프로필 이미지
돌머리

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

SSD의 이해 03 - SSD 네트웍 구조와 Multi Scale Feature Map/Anchor box의 활용

bounding box regerssion

작성

·

207

0

안녕하세요 선생님

bounding box regerssion에 의문점이 생겨 질문 드립니다.

강의를 수강하면서 object detection은 region proposal이 없으면 물체를 탐지하는 성능이 떨어진다고 알고있습니다.

궁금한점은 10:00 ~10:15쯤 유사한 유형의 데이터가 들어오면 학습 모델을 기반으로 object detection 힌다고 언급하십니다.

그런데, CCTV 영상과 같이 탐지하고자 하는 물체의 위치가 특정 좌표가 아닌 모든 좌표에서 검출 되는 경우 region proposal에 대한 bounding box regression 학습이 의미 없다고 생각되는데,  잘 못 생각한 것일까요?

즐거운 강의 감사합니다.

답변 3

1

권 철민님의 프로필 이미지
권 철민
지식공유자

학습 데이터는 영상 1과 같이 오브젝트가 중구 난방으로 되어 있는 것이 좋습니다. 

RPN은 어떻게 보면 anchor를 학습 시킨다고도 볼 수 있습니다.  feature map 상에서 object들이 anchor를 기준으로 얼마나 떨어졌는지, anchor기준으로 얼마나 크기가 되는지를 학습을 하는 것입니다. 그래서 매우 촘촘하게 anchor들이 있는 것이고, 이 anchor 상에 object를 mapping 할 수 있도록 학습하는 것입니다. 

object detection는  오브젝트가 어떠한 위치에 있는지 찾아냅니다. 그러려면 학습 데이터를 영상 1과 같이 해주는게 더 좋습니다. 

돌머리 님의 프로필 이미지
돌머리
질문자

감사합니다 :) 

0

돌머리 님의 프로필 이미지
돌머리
질문자

Region proposal이 특정 좌표에서만 검출을 하는 것으로 생각하고 계시는건지요? 그렇다면 특정 좌표란 어떤 것을 의미하는 건지요? 

Region proposal이  물체가 있는 모든 좌표에서 검출을 하는것은 알고있습니다.

위에서 말씀드린 특정 좌표의 의미를 영상2를 예로 들어보겠습니다.

영상 2에서는 탐지하고자 하는 물체 A,B는 왼쪽에 집중되어 나타납니다.

(집중되어 나타나는 부분을 특정 좌표라고 칭하였습니다.)

따라서 영상2의 데이터를 기반으로 학습한 경우 , 모델은 왼쪽에 물체들이 집중되어 있다고 학습합니다.

그러나 영상 1 같은 경우에는 탐지하고자 하는 물체들이 모든 좌표에서 중구난방으로 나타납니다.

이러한 경우  물체들이 모든 좌표에서 나타나므로, 학습을 해봤자 모든 좌표에서 특정 패턴 없이 모든 물체가 검출이 되는데 모델이 어떤 것을 학습할 수 있을지 의문이 들었고 최종적으로는 학습에 의미가 있는지에 대한 의문이 들었습니다. 

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까, 

그런데, CCTV 영상과 같이 탐지하고자 하는 물체의 위치가 특정 좌표가 아닌 모든 좌표에서 검출 되는 경우 region proposal에 대한 bounding box regression 학습이 의미 없다고 생각되는데,  잘 못 생각한 것일까요?

=> 질문의 의미를 제가 잘 이해하지 못했습니다. 지금 강의에서 말씀드리고 있는 것은 모두 특정 좌표가 아닌 모든 좌표에서 검출을 하는 것입니다. 혹 Region proposal이 특정 좌표에서만 검출을 하는 것으로 생각하고 계시는건지요? 그렇다면 특정 좌표란 어떤 것을 의미하는 건지요? 

돌머리 님의 프로필 이미지
돌머리

작성한 질문수

질문하기