해결된 질문
작성
·
95
1
안녕하세요! 강의 잘 듣고 있습니다
강의에서 docx 내부의 표를 markdown으로 변경하셨던데,
그러면 docx 문서를 전부 훑어서 모든 표를 markdown으로
일일이 수정해야할까요?
혹시 좀 더 간편한 방법이 있는 건 아닌지 궁금하여 여쭤봅니다!
답변 1
1
안녕하세요! 일일이 수정하는 것이 정확도는 제일 높겠지만, 말씀하신 것처럼 매우 비효율적입니다. 제가 사용해본 데이터를 수정하는 방법은 총 3가지가 있는데요
LLM의 multimodal 기능을 활용해서 변환
python-docx 패키지를 활용해서 row들을 읽어서 markdown으로 변환
Upstage Layout Analysis를 활용해서 변환
1번은 솔직히 성능이 너무 오락가락하고,
2번을 활용해서 코드를 잘 작성한다면 제일 안정적이고,
비용이 문제가 안된다면 3번이 현시점에서는 제일 간단한 방법인것 같습니다. 2번으로 코드를 작성하기 전에 회원가입하면 $30 크레딧을 주기 때문에 3번을 한번 시도해보시고 성능을 한번 검증해보시는 것을 추천드립니다!
답변 감사합니다! 강사님은 성능 확인은 어떤식으로 하시는 지 알 수 있을까요?