미해결
[개정판] 딥러닝 컴퓨터 비전 완벽 가이드
Yolo v2
안녕하세요
Yolo v2에 대해서 몇가지 질문드리고 싶어서 글 남깁니다.
1.
Direct Location Prediction 에서
여기서 tw와 th가 학습을 통해서 적절한 값을 향하는걸로 이해했습니다.그러면 그 값은 클래스마다 어떤 하나의 값으로 수렴되는게 아닌것같은데..
예를 들어 Car라는 클래스의 bbox를 예측하고 정답과 비교하며 학습한다고 했을때t값을 예측하고, 그 값을 넣은 b값과, 정답을 비교하고 옳은 t값을 구하고 나서의 일들이 헷갈립니다.
저 t값을 위해 아주 많은 노드들의 가중치값이 조금씩 변화하다 보면 Car라는 클래스의 bbox크기를 점점 더 잘 맞추게 되는건가요?
전체적인 매커니즘이 잘 이해가 되지 않아서 질문 드립니다.
2.
논문에서 자세히 밝히지 않아 질문드립니다.
앵커박스를 mAP 70이상들은 쓰지 않았는데 왜 굳이 쓰지 않은건가요?yolov2에서 바뀐것들중 큰 부분이라고 생각했는데 결국에 쓰지 않는것인지.. 이해가 잘 되지않습니다.
또한, 앵커박스를 쓰지 않았으면 yolov1과 같은 방식으로 2개의 box를 이용했다는것인지 궁금합니다.