Llama vision 이미지 해상도

Question

안녕하세요, 지금 한번 llama3.2 vision을 다른 이미지와 테스트를 해보고 있는데, vision이 인식하기 위한 최소 이미지 사이즈나 해상도가 있나요?
https://ollama.com/blog/llama3.2-vision
이 링크를 통해서 제 로컬에서 실험해보고 있는데, added image는 되는데, 그 이후 답변을 안해 줘서, 혹시 다른 이미지로도 테스트 가능하신지 궁금합니다!

AISchool · Answer

안녕하세요~. 반갑습니다.

Llama 3.2 vision 모델이 인식하기 위한 최소 이미지 사이즈는 특별히 언급된 내용이 없는 것 같습니다.

최대 이미지 사이즈 같은 경우 1120x1120 사이즈 까지 지원하는 것으로 알려져 있습니다.

colab에서 테스트해보시기가 어려우신 환경이실 경우

huggingface에 로그인하신뒤에

https://huggingface.co/meta-llama/Llama-3.2-11B-Vision-Instruct

위 링크로 Llama 3.2 vision instruct 모델 페이지에 접속하시면 우측에 [Inference Providers]라고 해당 부분에 이미지를 업로드하고 원하시는 프롬프트를 입력하셔서 테스트해보실 수 있는 환경을 제공하고 있으니 해당 방법으로 테스트해보시길 추천드립니다.

좋은 하루되세요~.

감사합니다.

인프런 커뮤니티 질문&답변

Llama vision 이미지 해상도