인프런 커뮤니티 질문&답변

작성한 질문수

최신 딥러닝 기술 Vision Transformer 개념부터 Pytorch 구현까지

학습과 평가하기

positional embedding 학습이 잘 안되는 문제

해결된 질문

24.04.19 08:13 작성

·

184

1

cifar10 말고 다른 이미지셋을 가지고 학습을 시켜보았는데, 시각화를 해 보니 수업에서 보여주셨던 것과는 다르게 positional embedding 학습이 잘 안되었습니다. 어디를 봐야할지 조언을 부탁드려도 될까요?

딥러닝 pytorch 컴퓨터-비전 vision-transformer

답변 1

0

딥러닝호형

지식공유자

2024. 04. 19. 15:19

안녕하세요.

매우 좋은 질문입니다.

먼저 딥러닝 모델 분석은 전체적으로 살펴봐야만 알 수 있기 때문에 정확한 판단을 하기 어렵다는 점을 말씀드리고 싶습니다.

몇 가지 추측을 해 본다면..

데이터 내의 객체 및 패턴에 따라 모델이 학습 되기 때문에 당연히 데이터에 따라 다를 수 있습니다.
이미지 내 객체의 위치 때문일 수도 있습니다. cifar10 같은 경우는 모든 객체가 정중앙에 있는 이미지를 패치화했기 때문에 수업에서 배운 내용대로 나올 수 있습니다. 만약 이미지 내 객체가 여러 개 혹은 위치가 상이한 경우 다르게 나올 수 있습니다.
이미지 크기에 따른 패치 수와 크기 영향일 수도 있습니다.
학습이 덜 된 것일 수도 있습니다.

감사합니다.

딥러닝호형 드림

작성한 질문수