질문 & 답변 - 인프런 | 커뮤니티

질문 게시판

고민있어요

스터디

팀 프로젝트

멘토링

멘토링 후기

수강평

With us

인프런 피드

블로그

인프런 소개

공지사항

대시보드

강의

홈

로드맵

더보기

묻고 답해요

143만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Mask R-CNN 관련

안녕하세요 강사님 항상 좋은강의 잘 듣고있습니다. 학습하던 도중 mask R-CNN 관련해서 질문드립니다. 1. Mask R-CNN 모델의 inference결과로 나오는 bbox의 좌표 results[0] 의 값이 [186.00633 203.48474 256.05243 253.83623 0.9983015] 위 5개 값중에 마지막 값은 confidence score 인것을 알겠는데 앞에 4개의 값이 각각 무엇을 뜻하는지 헷갈립니다 ㅠㅠ 처음부터 bbox의 xmin,ymin, width,height 라고 생각하는게 맞을까요? (Mask-RCNN 모델은 coco dataset format으로 학습) 2. segmentation이 진행되면 아래처럼 True , False 로 이루어진 array형태로 얻어지던데 object의 bbox정보와 segmentation정보를 매칭할 수 있는 방법이 있을까요? (최종적으로 각각의 바운딩박스 위에 class name이 아니라 픽셀 True 개수를 plot하는게 목표입니다.) 3. 영상 내에서 bbox를 추론은 하지만 시각화하지 않는 방법이 있을까요? (제가 사용하는 영상 데이터에 object들이 평균 3~400개가 detect 되어서 bounding box로 영상이 새까맣게 됩니다 ㅠㅠ ) 감사합니다.

윤도현 · 2022.03.04 · [개정판] 딥러닝 컴퓨터 비전 완벽 가이드

투표점수

0

조회수

549

답변

1

인기 태그

주간 인기글