3.3 Langchain 없이 Upstage RAG 구성

Question

안녕하세요 강사님. 🙂

질문 내용

3.3 강의를 듣던 중 chatGPT 말고 upstage로 구성하는 방법은 없을까? 하고 스스로 방법을 찾아봤습니다.

https://github.com/openai/tiktoken/blob/main/tiktoken/model.py

현재 tiktoken에서 제공되는 model 중 upstage의 solar 모델이 없는 것 같습니다.

upstage 로 RAG를 구성하는 방법도 배울 수 있을까요..?

강병진 · Answer

안녕하세요!

tiktoken에는 없지만 Upstage가 HuggingFace에는 모델을 활발하게 올려주셔서 huggingface에서 제공하는 Tokenizer를 사용하셔야 하는데요,

Upstage 공식문서에 사용방법이 나와있어서 전달드립니다. 아래 링크를 참고해주세요!

https://console.upstage.ai/docs/guides/counting-tokens

인프런 AI 인턴 · Answer

안녕하세요, 인프런 AI 인턴입니다. 김지환님.

Upstage를 사용하여 RAG(Retrieval-Augmented Generation) 구성하는 방법에 대한 궁금증이 있으시군요. 일반적으로 OpenAI API를 대신하여 Upstage API를 통해 RAG를 구성하는 것은 사실 가능합니다. 그러나 이를 위해서는 몇 가지 중요한 고려사항과 설정 단계가 필요합니다.

핵심 내용 요약

Upstage와 호환되는 모델 사용: Upstage는 자체적으로 모델을 제공하며, 이를 활용하여 LLM 작업을 수행할 수 있습니다. RAG를 구성하기 위해서는 Upstage에서 제공하는 API 키 및 도메인 지식에 대한 적절한 처리를 수행해야 합니다.
SDK나 API 활용: Upstage가 제공하는 Python SDK 또는 REST API를 활용하여 필요한 기능을 구현할 수 있습니다. 이를 통해 데이터의 임베딩 처리와 검색, 추론 등의 기능을 직접 구현할 수 있습니다.
데이터 전처리 및 저장소 설정: RAG를 구성하기 위해서는 데이터의 전처리와 적재, 검색이 가능해야 하므로, 적절한 벡터 데이터베이스와의 통합이 필요합니다. Chroma나 Faiss 등을 사용할 수 있습니다.

방법론 접근

Upstage를 활용하여 RAG를 구성하려면, 다음과 같은 순서로 진행할 수 있습니다:

Upstage API 또는 SDK를 통해 임베딩 생성 및 검색 기능 구현
Vector Database(예: Chroma) 활용하여 데이터 임베딩을 저장 및 검색
적절한 LLM 모델을 사용해 검색된 결과를 바탕으로 답변 생성

지금까지의 설명이 도움이 되었기를 바랍니다. 추가적인 세부적인 코드나 설정이 필요하시다면, Upstage의 공식 문서 혹은 관련 자료에서 API 활용에 대한 기술 문서를 참고하시면 좋겠습니다.

인프런 커뮤니티 질문&답변