인프런 커뮤니티 질문&답변

soodar17님의 프로필 이미지

작성한 질문수

RAG를 활용한 LLM Application 개발 (feat. LangChain)

3.5 Retrieval 효율 개선을 위한 데이터 전처리

R.A.G를 통한 구현의 Scope 문의

해결된 질문

24.08.01 17:07 작성

·

114

0

저는 R.A.G를 통한 LLM 챗봇을 개발을 하기위해 본 강의를 수강하기 시작했는데 너무 유읙합니다.

 

이럴 경우에도 embedding을 해서 R.A.G를 통해 retrieve가 가능한지 여쭤보고 싶어요.

데이터 크롤링 (컬럼 중에 리뷰데이터)의 데이터를 전처리해서 바로 Embedding을 통해 vector database에 넣어서 RAG를 활용할 수 있나요?

결과물에 대한 시나리오는 User가 챗봇에게 피부관련 사진 또는 문제에 대해서 고민을 입력하면 특정 논문 (강사님 강의에서 tax 파일과 같은 의미)을 기반으로 답변을 주게 되며 동시에 특정 쇼핑몰의 화장품의 리뷰들을 요약해주며 해당 제품을 추천하는 형태의 서비스입니다.

지금 생각으로는 데이터크롤링을 통해 긁어온 모든 자료들을 embedding해서 RAG할 수 있을 것 같은데 그것에 가능한지 궁금합니다.

답변 1

0

강병진님의 프로필 이미지
강병진
지식공유자

2024. 08. 01. 20:15

안녕하세요! 말씀하신 부분도 충분히 가능합니다.

리뷰데이터를 크롤링해와서 embedding한 후에 저장하시고,

  1. 사용자가 사진을 업로드하면, 사진을 multimodal 을 지원하는 LLM을 활용해서 분석한 다음에, 분석 결과를 활용해서 vector search를 실행하시거나

  2. 사용자가 고민을 입력하면 고민 내용을 바탕으로 vector search를 진행하시면 됩니다.

만약 랭체인으로 개발하신다면 tavily를 쉽게 연동할 수 있기 때문에 한번 시도해보셔도 좋을 것 같아요! taviliy도 약간의 무료 크레딧을 제공합니다. tavily를 연동하는 랭체인 문서도 같이 전달드릴게요~

https://python.langchain.com/v0.2/docs/integrations/tools/tavily_search/

soodar17님의 프로필 이미지
soodar17
질문자

2024. 08. 01. 23:27

강사님. 너무 감사합니다.

위의 내용을 기반으로 강의 하나 더 만들어 주시면 바로 저는 강의 수강하도록 하겠습니다~~~!!!

정말 좋은 강의 감사합니다.

soodar17님의 프로필 이미지

작성한 질문수

질문하기