인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

Inflearn Community Q&A

hyuntaklee's profile image
hyuntaklee

asked

RAG Master: From Basics to Advanced Techniques (feat. LangChain)

langchain 적용 서비스 배포/운영

Written on

·

64

0

안녕하세요 양질의 강의 감사히 잘 듣고 있습니다.

다름이 아니라 이렇게 langchain으로 RAG 를 접목시킨 서비스를 배포/운영 하는데에는 어떤 걸 더 배워야하는지 궁금합니다.

 

지금 생각으로는

1) langchain 소스코드로 gradio나 streamlit 챗봇을 만들고

2) 도커 이미지 같은걸 만들어서

3) AWS 서버에 배포 (혹은 서버리스)

 

혹시 제가 생각하는 과정이 맞는지, 아니면 현업에서는 다른 방법을 사용하는지 궁금합니다.

이번 강의를 듣고 만든 서비스 배포를 위해서는 어떤 기술을 더 익혀야하는지 알려주시면 감사하겠습니다.

 

python챗봇llmlangchainrag

Answer 2

1

안녕하세요. 판다스 스튜디오입니다.

개발 단계에서는 Streamlit이나 Gradio를 활용하여 프로토타입을 빠르게 개발할 수 있지만, 실제 프로덕션 환경에서는 FastAPI나 Flask를 사용하여 REST API 형태로 구현하는 것이 일반적입니다.

서비스의 안정적인 배포를 위해서는 Docker를 활용한 컨테이너화도 좋은 방법이라고 생각합니다. 배포 과정은 Vecel 등 서버리스, AWS EC2 등 다양한 옵션을 선택할 수 있습니다.

실제 운영 단계에서는 스케일링 전략, 비용 최적화, 에러 처리, 백업 및 복구 전략, API 버전 관리 등을 고려해야 합니다. 이를 위해 Docker, CI/CD 파이프라인, 인프라 관리 도구, 모니터링 및 로깅 시스템, 그리고 보안 관련 지식이 필요합니다. 체계적인 학습을 위해서는 FastAPI/Flask를 시작으로 Docker, Vecel 또는 AWS 서비스, CI/CD 파이프라인 구축, 그리고 모니터링 및 로깅 설정 순으로 진행하는 것이 효과적입니다.

hyuntaklee님의 프로필 이미지
hyuntaklee
Questioner

답변 감사합니다. 이어서 한 가지만 더 여쭤봐도 될까요?

제가 Django 로 웹개발을 배우고 있는데 혹시 이런 챗봇 개발을 위해서는 django 보다 말씀해주신 FastAPI/Flask 로 개발을 하는 것이 더 나은지 궁금합니다. 만약 현업에서 FastAPI/Flask를 더 선호해서 사용하고 굳이 django를 고수해서 얻을 효용이 없다면 FastAPI쪽으로 다시 배우는 게 좋을 거 같아서 입니다.

챗봇이나 RAG 시스템과 같은 AI 서비스 개발에 FastAPI나 Flask를 사용하는 이유는 이러한 서비스들이 주로 경량화된 API 엔드포인트와 비동기 처리를 지원하기 때문입니다.

하지만 복잡한 비즈니스 로직이나 데이터베이스 관리가 필요한 대규모 웹 애플리케이션 개발에는 Django가 더 적합합니다.

제안드리고 싶은 방향은, 웹개발 프레임워크인 Django를 메인으로 공부하면서 FastAPI를 추가로 학습하시는 것입니다. FastAPI는 상대적으로 배우기 쉽기 때문에 Django 경험이 있으시다면 빠르게 익힐 수 있습니다.

hyuntaklee님의 프로필 이미지
hyuntaklee
Questioner

그 방향으로 공부해보겠습니다.

자세한 답변 감사드립니다!

0

안녕하세요, 인프런 AI 인턴입니다. Hyuntak Lee님.

Langchain을 활용하여 RAG를 접목한 서비스를 배포하고 운영하기 위해 필요한 단계에 대한 질문을 주셨습니다. 현재 계획하신 과정은 매우 적절하고, 실제로 많은 개발자들이 사용하는 방법입니다. 다만, 추가적으로 고려할 수 있는 요소와 기술들을 몇 가지 소개해 드리겠습니다.

  1. 챗봇 개발 (Gradio or Streamlit):

    • 이미 언급하신 것처럼, Gradio와 Streamlit은 챗봇의 인터페이스를 구현하는데 훌륭한 도구입니다. 간단한 UI를 빠르게 구축할 수 있으며, Python 코드와 직접적으로 통합할 수 있습니다.
  2. 컨테이너화 (Docker):

    • 도커를 활용하여 앱을 컨테이너화하면, 다양한 환경에서 일관된 실행을 보장할 수 있습니다. Docker Compose를 함께 배우시면, 여러 서비스를 한 번에 관리할 때 도움이 됩니다.
  3. 배포 플랫폼 선택 (AWS, GCP 등):

    • AWS EC2, AWS Lambda(서버리스) 등은 좋은 선택지입니다. 서버리스는 초기 설정이 간단하고, 관리할 서버가 없는 장점이 있으나, 장기적으로 EC2가 비용 면에서 효율적일 수 있습니다.
  4. 데이터베이스 및 스토리지 선택:

    • 실시간 데이터를 저장하거나 검색 속도를 높이기 위해, 데이터베이스나 캐시 시스템(Redis 등)을 고려할 수 있습니다.
  5. CI/CD:

    • GitHub Actions, Jenkins 등과 같은 도구를 통해 지속적 통합과 배포 파이프라인을 구축하면, 변경사항이 서버에 자동으로 반영되도록 할 수 있습니다.
  6. 모니터링 및 로깅:

    • 서버 작동 상태 모니터링과 성능 최적화를 위해 Prometheus, Grafana, ELK Stack 등을 활용할 수 있습니다.
  7. 보안:

    • 배포 후 서비스의 보호를 위해 인증/인가 처리 및 SSL, 방화벽 설정 등에 대한 이해가 필요합니다.

현업에서는 프로젝트의 규모와 요구사항에 따라 도구와 기술을 선택합니다. 예를 들어, 대규모 시스템에서는 Kubernetes 같은 오케스트레이션 도구를 사용하기도 합니다.

추가로, 아래 유사한 링크를 통해 관련 정보를 참고하실 수 있습니다:
- poetry add python-dotenv langchain langchain_openai gradio
- Error in loading PDF or creating vectorstore

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

hyuntaklee's profile image
hyuntaklee

asked

Ask a question