인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

배진영님의 프로필 이미지

작성한 질문수

[개정판] 딥러닝 컴퓨터 비전 완벽 가이드

Faster RCNN의 이해 02 - Anchor Box를 활용한 RPN 구성

학습 질문입니다.

작성

·

41

0

질문 1) 강의의 마지막 부분에서 결론적으로 t와 t*의 차이가 동일시 되도록 학습을 진행하는것이 맞을까요?

질문 2) 강의 7분부터 나오는 슬라이드의 맨 위에 적힌 글에서는 "g.t-예측 박스 차이"와 "anchor-g.t 차이"를 동일하게 하라고 적혀있는데 아래 식과 다음 챕터 강의 내용으로 보았을 때는 "anchor-예측 박스 차이"와 "g.t-anchor 차이"를 동일하게 하라고 하는 것 같습니다. 무엇이 맞는지 궁금합니다.

답변 2

0

권 철민님의 프로필 이미지
권 철민
지식공유자

질문 1) 강의의 마지막 부분에서 결론적으로 t와 t*의 차이가 동일시 되도록 학습을 진행하는것이 맞을까요?

=> 이전 질문에서 답변 드렸지만, 원론적으로는 t와 t*의 차이가 없도록 하는게 목표지만, 그렇게 바로 학습을 적용할 수 없어서 anchor box와의 차이를 동일하게 하는게 목표입니다.

질문 2) 강의 7분부터 나오는 슬라이드의 맨 위에 적힌 글에서는 "g.t-예측 박스 차이"와 "anchor-g.t 차이"를 동일하게 하라고 적혀있는데 아래 식과 다음 챕터 강의 내용으로 보았을 때는 "anchor-예측 박스 차이"와 "g.t-anchor 차이"를 동일하게 하라고 하는 것 같습니다. 무엇이 맞는지 궁금합니다.

=> 음, 이건 슬라이드 맨위의 적힌 글이 오해를 불러 올 수 있도록 적혀 있군요. "anchor-예측 박스 차이"와 "g.t-anchor 차이"를 줄이는 방향으로 학습/예측을 하는 것으로 정정합니다.

배진영님의 프로필 이미지
배진영
질문자

감사합니다!

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. 배진영님, 좋은 질문 감사드립니다.

질문 1과 관련된 내용에서는 t와 t*의 차이를 줄이는 부분이 있습니다. 일반적으로 딥러닝 모델의 학습 과정에서 특정 목표와 실제 예측값의 차이를 최소화하는 방향으로 최적화를 진행하게 됩니다. 이를 통해 최적의 모델 파라미터를 찾고자 하는 것이 학습의 주요 목표입니다.

질문 2에서는 “g.t-예측 박스 차이”와 “anchor-g.t 차이”를 동일하게 하라는 지시사항이 등장하는 부분에서 혼란이 있을 수 있습니다. 그러나 객체 탐지 모델에서 anchor-box를 기준으로 학습을 진행하는 것이 일반적입니다. 즉, anchor-box와 예측 박스 사이의 차이를 줄이는 방향으로 학습을 진행함으로써, ground truth와 anchor-box가 갖는 상대적인 거리 차이를 줄이는 방식입니다.

아래에 관련된 유사한 질문과 답변이 있어 링크를 통해 추가 정보를 참고하시는 것을 추천드립니다:

질문에 대한 보다 구체적인 답변이나 설명은 강의 내용을 다시 확인하시거나, 해당 주제와 관련한 다른 질문들을 참고하시면 도움이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.