인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

neyeum님의 프로필 이미지

작성한 질문수

모두를 위한 대규모 언어 모델 LLM(Large Language Model) Part 2 - 랭체인(LangChain)으로 나만의 ChatGPT 만들기

혹시 로컬llm을 활용해서 RAG를 구현하는 예제도 한번 올려주시면 안될까요?

작성

·

127

·

수정됨

0

기업이나 연구소에 근무하시면서 상용 llm을 활용해서 서비스를 개발하시는 분들도 많겠지만

로컬pc 24G정도의 vram에 ollama로 Gemma3 27B ( 모델용량 17GB)정도의 모델을 올리면
개인이 가지고 있는 문서들을 따로 토큰을 쓰지않고도 벡터화해서 필요할때 질의응답 하는 용도로 활용가능할거 같은데요
https://m.blog.naver.com/PostView.naver?blogId=se2n&logNo=223625573379&navType=by

강의중에 codeLlama 연동하시는 부분은 봤는데 ollama로 연동하는 방법이 궁금합니다

답변 2

1

AISchool님의 프로필 이미지
AISchool
지식공유자

안녕하세요~. 반갑습니다.

 

ChatOllama 모듈을 이용해서 llama 모델을 연동해서 RAG를 구현하는 방법을 설명한 아래 문서와 소스코드를 참조하세요.

https://langchain-ai.github.io/langgraph/tutorials/rag/langgraph_adaptive_rag_local/

 

혹시 [모두를 위한 대규모 언어 모델 LLM Part 5 - LangGraph로 나만의 AI 에이전트 만들기] 강의도 수강하신다면 해당 강의에서 Llama 모델을 ollama로 연동하는 방법을 설명한 [Llama 모델을 이용해서 Adaptive RAG 시스템 만들기] 강의 영상을 참조하세요.

 

좋은 하루되세요~.

감사합니다.

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다.

neyeum님, 로컬에서 실행 가능한 LLM을 활용한 RAG(제거검색 생성)를 구현하고 싶으신 점에 대해 말씀해주셨는데요. 로컬에서의 LLM 활용은 상용 API를 사용하지 않고 개인 데이터를 보다 자유롭게 처리할 수 있다는 장점이 있습니다.

링크로 주신 내용을 살펴보니, 로컬 환경에서도 LLM을 활용하기 위한 업데이트된 정보를 제안하시고 계신 모습을 보게 되어 반가웠습니다.

로컬 LLM을 활용한 RAG 구현 방법

  1. 모델 선택: 먼저 VRAM 용량에 맞는 모델을 선택하는 것이 중요합니다. 주로 Gemma2 27B 같은 고용량 모델을 활용한다고 하셨지만, VRAM 용량에 맞추어 13B나 7B 버전을 고려해보셔도 좋습니다.

  2. 환경 설정: 모형을 로컬에서 실행할 수 있도록 PyTorch나 TensorFlow 환경을 준비합니다. 이 과정에서 CUDA를 활용한 GPU 엔진이 필요합니다.

  3. 벡터 스토어 구축: 기본적으로 사용자가 제공하는 문서를 벡터화하여 데이터베이스에 저장합니다. 데이터베이스는 FAISS나 HNSW 같은 라이브러리를 활용할 수 있습니다.

  4. 질의응답 시스템 구성: 사용자로부터 질문을 수집하고, 벡터화된 데이터와의 유사성을 비교하여 가장 관련 있는 정보를 제공하도록 하고, 이를 기반으로 최종 응답을 생성합니다.

여기서 가장 중요한 부분은 LLM에서 생산된 텍스트와 로컬 데이터의 고품질 매칭을 위한 리트리버(탐색 모델) 세팅입니다.

참고할 수 있는 리소스

  • PyTorch나 Hugging Face Transformers를 사용하여 모델 로딩 및 실행 실습이 가능합니다.
  • LangChain 같은 툴은 이런 작업을 간소화하기에 유용합니다.

이런 구성은 RAG 응용에 크게 도움이 되며, 개인 환경에서 LLM을 최적화하여 실습하는 데 도움이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

neyeum님의 프로필 이미지

작성한 질문수

질문하기