R.A.G를 통한 구현의 Scope 문의

Question

저는 R.A.G를 통한 LLM 챗봇을 개발을 하기위해 본 강의를 수강하기 시작했는데 너무 유읙합니다.

이럴 경우에도 embedding을 해서 R.A.G를 통해 retrieve가 가능한지 여쭤보고 싶어요.

데이터 크롤링 (컬럼 중에 리뷰데이터)의 데이터를 전처리해서 바로 Embedding을 통해 vector database에 넣어서 RAG를 활용할 수 있나요?

결과물에 대한 시나리오는 User가 챗봇에게 피부관련 사진 또는 문제에 대해서 고민을 입력하면 특정 논문 (강사님 강의에서 tax 파일과 같은 의미)을 기반으로 답변을 주게 되며 동시에 특정 쇼핑몰의 화장품의 리뷰들을 요약해주며 해당 제품을 추천하는 형태의 서비스입니다.

지금 생각으로는 데이터크롤링을 통해 긁어온 모든 자료들을 embedding해서 RAG할 수 있을 것 같은데 그것에 가능한지 궁금합니다.

강병진 · Answer

안녕하세요! 말씀하신 부분도 충분히 가능합니다.

리뷰데이터를 크롤링해와서 embedding한 후에 저장하시고,

사용자가 사진을 업로드하면, 사진을 multimodal 을 지원하는 LLM을 활용해서 분석한 다음에, 분석 결과를 활용해서 vector search를 실행하시거나
사용자가 고민을 입력하면 고민 내용을 바탕으로 vector search를 진행하시면 됩니다.

만약 랭체인으로 개발하신다면 tavily를 쉽게 연동할 수 있기 때문에 한번 시도해보셔도 좋을 것 같아요! taviliy도 약간의 무료 크레딧을 제공합니다. tavily를 연동하는 랭체인 문서도 같이 전달드릴게요~

https://python.langchain.com/v0.2/docs/integrations/tools/tavily_search/

인프런 커뮤니티 질문&답변

R.A.G를 통한 구현의 Scope 문의