인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

송정준님의 프로필 이미지

작성한 질문수

모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 1 - Llama 2 Fine-Tuning 해보기

Llama 3.2 Vision 11B 모델의 한국어 VQA 성능 테스트하기

Llama vision 이미지 해상도

작성

·

59

0

안녕하세요, 지금 한번 llama3.2 vision을 다른 이미지와 테스트를 해보고 있는데, vision이 인식하기 위한 최소 이미지 사이즈나 해상도가 있나요?
https://ollama.com/blog/llama3.2-vision
이 링크를 통해서 제 로컬에서 실험해보고 있는데, added image는 되는데, 그 이후 답변을 안해 줘서, 혹시 다른 이미지로도 테스트 가능하신지 궁금합니다!

답변 1

0

AISchool님의 프로필 이미지
AISchool
지식공유자

안녕하세요~. 반갑습니다.

 

Llama 3.2 vision 모델이 인식하기 위한 최소 이미지 사이즈는 특별히 언급된 내용이 없는 것 같습니다.

최대 이미지 사이즈 같은 경우 1120x1120 사이즈 까지 지원하는 것으로 알려져 있습니다.

 

colab에서 테스트해보시기가 어려우신 환경이실 경우

huggingface에 로그인하신뒤에

https://huggingface.co/meta-llama/Llama-3.2-11B-Vision-Instruct

위 링크로 Llama 3.2 vision instruct 모델 페이지에 접속하시면 우측에 [Inference Providers]라고 해당 부분에 이미지를 업로드하고 원하시는 프롬프트를 입력하셔서 테스트해보실 수 있는 환경을 제공하고 있으니 해당 방법으로 테스트해보시길 추천드립니다.

 

inference_providers_위치.png.webp

 

 

좋은 하루되세요~.

감사합니다.