작성
·
206
0
컨볼루션 레이어를 통과한 prediction데이터중
85개의 데이터가
bbox정보, Score, classes라는 논리가 무엇일까요??ㅜㅜ
답변 2
0
85개의 데이터로 매핑되는 것은 이해가 됩니다~
그런데, 학습이 진행이 되고 결과값(가중치들이)으로 나온 데이터들이 박스정보, 클랙스 확률 정보로 추론이 되는지가 궁금합니다.
dense층과 같은 원리라고 생각하면 될까요??
0
안녕하십니까,
음, 이해가 안되시는 부분을 상세하게 말씀해 주시면 좋을 것 같습니다만.
85개가 bbox정보, score, class정보로 어떻게 매핑되는지를 물어보시는 건지요? 그렇다면
먼저 coco 데이터 세트를 기준으로 할 때
coco는 object의 클래스 유형이 80개가 있습니다.
그래서 85개 중에 80개는 개별 클래스 id 0 부터 79까지의 클래스 예측 확률이 들어가 있습니다. 이들 80개 중에 가장 큰 값으로 클래스를 예측합니다.
그리고 bbox는 오브젝트 bbox의 좌표(중심 x,y좌표, 너비, 높이)는 4개 값으로 표현됩니다.
마지막 score는 오브젝트일 확률을 의미하며 이는 1개 값으로 표현됩니다.
그래서 총 85개 입니다.
첨부로 만약 pascal voc 데이터를 이용한다면 pascal voc는 총 20개의 클래스가 있으므로 총 25개로 출력됩니다.
감사합니다.
네, dense와 비슷한 원리로 생각하면 될 것 같습니다.
batch, grid size * grid_size * num_anchor 차원으로 bbox정보, class정보등이 들어가 있으니까, 해당 정보를 추출하는 과정이라고 보시면 됩니다.