인프런 커뮤니티 질문&답변

rosy님의 프로필 이미지

작성한 질문수

RAG를 활용한 LLM Application 개발 (feat. LangChain)

4.1 Streamlit 설치와 user message 작성

docx에 표

해결된 질문

24.07.30 10:51 작성

·

76

1

안녕하세요! 강의 잘 듣고 있습니다

강의에서 docx 내부의 표를 markdown으로 변경하셨던데,

그러면 docx 문서를 전부 훑어서 모든 표를 markdown으로

일일이 수정해야할까요?

혹시 좀 더 간편한 방법이 있는 건 아닌지 궁금하여 여쭤봅니다!

답변 1

1

강병진님의 프로필 이미지
강병진
지식공유자

2024. 07. 30. 12:25

안녕하세요! 일일이 수정하는 것이 정확도는 제일 높겠지만, 말씀하신 것처럼 매우 비효율적입니다. 제가 사용해본 데이터를 수정하는 방법은 총 3가지가 있는데요

 

  1. LLM의 multimodal 기능을 활용해서 변환

  2. python-docx 패키지를 활용해서 row들을 읽어서 markdown으로 변환

  3. Upstage Layout Analysis를 활용해서 변환

1번은 솔직히 성능이 너무 오락가락하고,

2번을 활용해서 코드를 잘 작성한다면 제일 안정적이고,

비용이 문제가 안된다면 3번이 현시점에서는 제일 간단한 방법인것 같습니다. 2번으로 코드를 작성하기 전에 회원가입하면 $30 크레딧을 주기 때문에 3번을 한번 시도해보시고 성능을 한번 검증해보시는 것을 추천드립니다!

rosy님의 프로필 이미지
rosy
질문자

2024. 07. 30. 15:40

답변 감사합니다! 강사님은 성능 확인은 어떤식으로 하시는 지 알 수 있을까요?

강병진님의 프로필 이미지
강병진
지식공유자

2024. 07. 30. 16:26

저는 성능 평가를 위한 정답지(Golden Dataset)을 기반으로 LLM을 활용해서 (LLM as judge) 확인하고 있습니다~

rosy님의 프로필 이미지

작성한 질문수

질문하기