Inflearn brand logo image
Inflearn brand logo image
채널톡 아이콘

인프런 커뮤니티 질문&답변

이홍기님의 프로필 이미지

작성한 질문수 9

RAG를 활용한 LLM Application 개발 (feat. LangChain)

4.5 Streamlit Cloud를 활용한 서비스 배포

선생님 질문 있습니다 한번 봐주세여~!

작성

·

67

0

안녕하세요 선생님 수업 잘 듣고 열심히 만들고 있는데 한가지 해결이 안되는 부분이 있어 이렇게 글 남깁니다.

문서를 100개를 넣고, LLM이 대답할 때 인사규정에 따르면 혹은 인사규정을 참조하여 규정명을 나오게 하고 싶은데, 매칭이 잘안되거나 잘못된 규정명을 알려주곤 하는데 정확한 방법이 있을까요? 백터 DB에서 메타 데이터 지정하는 방식 이거나 document에 정의해 호출하는 방식 등을 사용하는데 .. 선생님도 이렇게 하실까요??

답변 2

0

강병진님의 프로필 이미지
강병진
지식공유자

안녕하세요 좋은 질문 감사합니다

데이터를 벡터DB에 저장할 때 조금 더 전처리를 세밀하게 하셔야 되는 상황인 것 같습니다. 단순히 글자수로만 자르면 문맥이 이상하게 엮여서 참조문서를 이상하게 가져오는 것 같아요.

 

아니면 예제들을 활용해서 어떤 인풋이 들어갔을 때 어떤식으로 답변을 생성해야 하는지 조금 더 구체적으로 작성해주는 것도 좋을 것 같습니다. 강의에서는 사용자 질문 <-> LLM 답변의 few shots만 활용하는데, 참고되는 문서들도 같이 few shots로 활용하는 방법이 있을 것 같고.

 

그래도 안되면 reranking을 해서 가져온 문서들의 우선순위를 한번 다듬을 필요가 있을 것 같습니다

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. 이홍기님.

강의 수강 중 문의 주신 내용에 대해 답변드리겠습니다. 문서 100개를 처리하여 LLM이 규정명을 정확하게 참조하도록 하고자 하신다고 하셨는데요, 몇 가지 개선 방안을 제안드리겠습니다.

  1. 메타데이터 활용:

    • 각 문서에 메타데이터로 규정명을 명확히 지정하여, 검색 시 해당 메타데이터를 참조하도록 설정합니다. 이는 규정명을 직접 문서에서 검색하는 것보다 메타데이터 필터링을 통해 더욱 정확한 결과를 도출하는 데 유리할 수 있습니다.
  2. 문서 구조화 및 인덱싱:

    • 문서 내에서 규정명을 쉽게 파악할 수 있도록 문서 구조를 잘 정의합니다. 예를 들어, 규정명이 포함된 섹션을 명확히 구분하거나 본문에 규정명을 반복적으로 명시하는 방법입니다.
  3. 벡터 DB 설정 및 검색 최적화:

    • 벡터 DB에서 문서를 인덱싱할 때, 규정명을 포함한 문서의 주요 내용을 벡터화하고 검색 시 이를 참조합니다. 만약 검색 정확도가 떨어진다면 검색 쿼리를 보강하거나 인덱싱 방식을 조정하여 개선할 수 있습니다.
  4. LLM 구현 상의 개선:

    • LLM의 응답 패턴을 학습시키는 과정에서 규정명을 올바르게 표시하도록 특정 패턴이나 규칙을 추가하는 것도 유용할 수 있습니다.

위와 같은 방법들을 통해 매칭의 정확성을 높일 수 있습니다. 추가적으로 관련된 강의 내용이나 강사님의 답변을 참조하여 문제 해결에 도움이 되시길 바랍니다.

관련 질문에 대한 강사님의 답변을 참고해 보세요:
- “문서의 수에 따른 답변 정확성”

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.