인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

길태형님의 프로필 이미지

작성한 질문수

RAG를 활용한 LLM Application 개발 (feat. LangChain)

3.5 Retrieval 효율 개선을 위한 데이터 전처리

맞는 답변은 5,000만원 이하에 대한 내용이어야 할것 같아요

해결된 질문

작성

·

91

0

올려주신 영상에서 LLM 답변이

5,000만원 초과 8,800만원 이하 구간에 대한 내용으로 나왔는데요,

 

1,400만원 초과 5,000만원 이하 구간에 대한 내용이 나와야 맞는 것 같아요

 

UpstageEmbeddings 사용하니까 이 구간에 대한 정보로 알려주네요

답변 2

0

강병진님의 프로필 이미지
강병진
지식공유자

안녕하세요! 참조한 구간을 떠나서 답변은 동일하게 나오던가요?

금액만 보면 말씀하신 것처럼 5천만원 이하 구간에 들어가는게 맞습니다. 이게 제가 Upstage 임베딩이 한국어 임베딩에서는 제일 좋다고 말씀드리는 이유입니다.

그런데 문맥만 따져보면 금액을 잘 계산한다는 전제하에 참고하는 것은 두 구간 모두 맞다고 보셔도 됩니다 5천만원 초과 8800 이하 구간에서도 5천만원까지는 고정금액 + 초과금액에 따른 세율 적용이기 때문에 문맥상 앞에있는 고정금액만 가져왔다면 답변은 정확하게 생성했을거에요.

3.6강으로 넘어가시면 조금 더 정확한 답변을 보실 수 있을겁니다. 한번 확인하시고 추가로 공유해주셔도 좋습니다~

길태형님의 프로필 이미지
길태형
질문자

아 네! 3.6강 확인해보니 구간에 대한 말씀을 해주셨네요!

Upstage 임베딩이 더 좋은걸 확인한 케이스 같습니다

답변도 동일하게 나왔습니다.

감사합니다~

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다. 길태형님.

질문 주신 내용은 LLM이 특정 연봉 구간에 대한 세금 정보를 정확하게 제공하지 못한 것에 대한 내용인 것 같습니다. LLM이 제공하는 답변은 입력된 문서 데이터 및 설정된 매개변수에 많이 의존합니다. 따라서, 정확한 구간 정보를 얻기 위해서는 모델의 데이터셋과 임베딩 설정을 더 세심하게 조정할 필요가 있습니다.

비슷한 맥락에서, LLM이 주어진 범위에 맞춰서 결과를 제공할 수 있도록 적절한 데이터 전처리나 업스테이지 같이 한국어에 최적화된 임베딩 모델을 사용하는 것이 도움이 될 수 있습니다. 사용하고 계신 UpstageEmbeddings 모델은 실제로 한국어와 관련된 다양한 작업에서 우수한 성능을 보이는 것으로 알려져 있습니다.

좀 더 구체적인 정보를 위해서는 강의의 다음 내용을 참고하시거나, 이미 답변된 질문들을 강사의 설명 에서 확인해 보시는 것도 좋을 것 같습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.