인프런 커뮤니티 질문&답변

신창호님의 프로필 이미지

작성한 질문수

RAG를 활용한 LLM Application 개발 (feat. LangChain)

3.2 LangChain과 Chroma를 활용한 RAG 구성

docx2txt 라이브러리에 대한 질문!

24.09.07 20:42 작성

·

38

0

선생님 강의 잘 듣고 있습니다.

강의 내용과 함께 직접 하나하나 따라하고 공식문서도 확인하면서 해보던중, 워드 문서를 loader하기위해 docx2txt라이브러리를 사용하는 것을 봤습니다. 물론 오픈소스 라이브러리이고, 전부터 잘 사용해온것 같아 이걸로 진행해도 이상없지만,

LangChain v0.2공식문서에서는 docx파일을 로더하기위해선 Azure AI Document Intelligence으로 예시가 되어 있더라고요.
(제가 못찾은 거 일 수도 있어요..)

어떤 차이가 있는 건지...비용이 드는 건지, 혹여나 한국어문서이다보니 뭐가 더 잘 loader하는지 궁금합니다!

답변 1

1

강병진님의 프로필 이미지
강병진
지식공유자

2024. 09. 07. 22:28

좋은 질문 감사합니다! Azure AI Document Intelligence를 사용하면 docx2txt를 사용하는 것보다 정확도는 훨씬 뛰어날거에요! 하지만 비용이 발생한다는 단점이 있습니다 ㅠㅠ