MMDetection에서 densehead와 roihead의 차이

Question

안녕하세요. 강의 정말 잘 듣고있습니다!
다름이 아니라 MMDetection을 다시 공부하던 중 모델 아키텍쳐 부분에서 densehead와 roihead의 차이가 궁금해져서 이렇게 글을 남깁니다.
설명에는 densehead와 roihead 모두 object의 위치와 classification을 수행한다고 나와있어서요..

감사합니다!

권 철민 · Answer

안녕하십니까,

ROI Head와 Dense Head는 mmdetection에서 RPN을 구성할 때 사용하는 용어 같군요.

RPN 즉 최종 ROI 즉 Object가 있을 만한 위치와 Object 여부(이진 분류)를 판별해주는 네트웍에서(그러니까, 이전에 Selective Search에서 하던 역할을 수행) 마지막 Layer 부분을 의미합니다. ROI Head에서 RPN의 최종 Loss 계산 및 Object가 있을 만한 위치를 기반으로 roi 매핑을 feature map에 시켜주고 Object 여부를 최종 예측하는 걸로 보입니다.

Dense Head에서는 이렇게 ROI Head에서 매핑된 Feature Map을 기반으로 실제 Object의 위치와 Object 클래스값(멀티 클래스 분류)를 학습 및 예측해 주는 역할을 수행해 줍니다.

감사합니다.

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. jcy4023님, 질문해 주셔서 감사합니다.

MMDetection에서 ‘densehead’와 ‘roihead’는 둘 다 객체의 위치와 클래스를 찾기 위한 모듈이지만, 그 사용 방식이 다르기 때문에 조금 헷갈릴 수 있습니다.

DenseHead: 이 모듈은 주로 One-Stage Detectors에서 사용되며, 모든 feature map의 위치에서 객체를 추론합니다. RetinaNet이나 SSD와 같은 모델에서 많이 활용됩니다. 특징적으로 모든 위치에서 동시에 객체를 탐지하므로 빠른 추론 속도를 자랑합니다.
ROIHead: 이는 주로 Two-Stage Detectors에서 사용됩니다. Faster R-CNN이나 Mask R-CNN과 같은 모델에서 사용하는 방식으로, 먼저 객체 후보 영역(Regions of Interest)을 예측하고, 그 후보 영역 내에서 객체의 세밀한 위치와 클래스를 예측합니다. 이로 인해 더 정확한 결과를 제공할 수 있지만, 속도가 상대적으로 느립니다.

기본적으로 두 방식은 다양한 객체 탐지 요구사항에 맞춰 사용되며, 속도와 정확도의 트레이드오프를 고려해 선택할 수 있습니다.

추가로, mmdetection 관련 질문이시라면 다음 링크들도 도움을 받을 수 있습니다:
- “mmdetection에서의 mask-rcnn에 대해서 질문이 있습니다”
- “mmdetection 모델 생성 원리가 궁금합니다.”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

인프런 커뮤니티 질문&답변

MMDetection에서 densehead와 roihead의 차이