작성
·
56
0
선생님 강의 잘 듣고 있습니다.
강의 내용과 함께 직접 하나하나 따라하고 공식문서도 확인하면서 해보던중, 워드 문서를 loader하기위해 docx2txt라이브러리를 사용하는 것을 봤습니다. 물론 오픈소스 라이브러리이고, 전부터 잘 사용해온것 같아 이걸로 진행해도 이상없지만,
LangChain v0.2공식문서에서는 docx파일을 로더하기위해선 Azure AI Document Intelligence으로 예시가 되어 있더라고요.
(제가 못찾은 거 일 수도 있어요..)
어떤 차이가 있는 건지...비용이 드는 건지, 혹여나 한국어문서이다보니 뭐가 더 잘 loader하는지 궁금합니다!
답변 1
1
좋은 질문 감사합니다! Azure AI Document Intelligence를 사용하면 docx2txt를 사용하는 것보다 정확도는 훨씬 뛰어날거에요! 하지만 비용이 발생한다는 단점이 있습니다 ㅠㅠ