인프런 커뮤니티 질문&답변

금기문님의 프로필 이미지
금기문

작성한 질문수

직장인에게 꼭 필요한 파이썬-아래아한글 자동화 레시피

PDF 문서를 HWP 문서로 변환하는 방법이 있나요?

해결된 질문

작성

·

1.6K

1

PDF를 오피스 문서로 변환하기 기능을 python으로 실행하는 방법이 있을까요??

API 문서에서는 찾아보아도 관련 내용이 없네요.

감사합니다.

답변 1

1

일코님의 프로필 이미지
일코
지식공유자

금기문님 안녕하세요?^^

말씀하신 내용의 API가 제공되고 있습니다.

(한/글2018까지는 테스트를 해보았는데, 이전 버전의 지원여부는 확실하지 않습니다ㅜ)

아래와 같이 두 가지 방법 중 선호하시는 방법으로 실행하시면 됩니다.

# <1. pyhwpx 모듈을 이용하는 방법>
# pip install pyhwpx


from pyhwpx import Hwp

hwp = Hwp()
hwp.open_pdf("./sample.pdf")
# <2. pywin32 페키지를 이용하는 방법>
# pip install pywin32


import win32com.client as win32

hwp = win32.gencache.EnsureDispatch("hwpframe.hwpobject")
hwp.XHwpWindows.Item(0).Visible = True

pset = hwp.HParameterSet.HFileOpenSave
hwp.HAction.Run("CallPDFConverter")
hwp.HAction.GetDefault("FileOpenPDF", pset.HSet)
pset.Attributes = 0
pset.filename = "c:\\users\\user\\desktop\\sample.pdf"
pset.OpenFlag = 0
hwp.HAction.Execute("FileOpenPDF", pset.HSet)

시연화면은 아래와 같습니다.

 

<pyhwpx를 사용하는 경우>

image

<win32com을 이용하는 경우(결과는 동일)>

image

도움이 되었으면 좋겠습니다.
추가 질문 있으신 경우 댓글 남겨주시기 바랍니다.

행복한 하루 되세요^^

안녕하세요. colab 에서 pyhwp 를 사용하는 코드를 실행했는데 오류가 떠서요 ㅠ

!pip install --user --pre pyhwp

 

import sys

sys.path.append(r'/usr/local/lib/python3.10/dist-packages')

 

from pyhwp import Hwp

hwp = Hwp()

hwp.open_pdf("/content/B project pdf example.pdf")

이렇게 작성했는데

from pyhwp import Hwp 이 부분에서

ModuleNotFoundError: No module named 'pyhwp' 이렇게 뜨네요..

 

Requirement already satisfied: pyhwp in /usr/local/lib/python3.10/dist-packages (0.1b15) 이 부분을 참고해서 경로 추가하는 코드까지 작성했는데 뭐가 잘못된건지 모르겠어요 ㅠ

 

도움주실 수 있을까요?

일코님의 프로필 이미지
일코
지식공유자

from pyhwpx import Hwp 입니다.

모듈 이름이 pyhwpx예요.

감사합니다

!pip install pyhwpx

from pyhwpx import Hwp

hwp = Hwp()

hwp.open_pdf("/content/B project pdf example.pdf")

이번에는 이런식으로 작성했는데,

오류가 이렇게 뜨네요 ㅠ 혹시 코랩에서는 작동이 안되는 건가요?

ERROR: pyhwpx has an invalid wheel, pyhwpx has an invalid wheel, multiple .dist-info directories found: pyhwpx-0.10.13.dist-info, pyhwpx-0.10.14.dist-info
---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)

ModuleNotFoundError: No module named 'pyhwpx'
일코님의 프로필 이미지
일코
지식공유자

죄송합니다. 업데이트를 해 주세요ㅜㅜㅜ 왜 하필 그 버전을 갖고 계시지ㅜㅜㅜㅜㅜ

pip install --upgrade pyhwpx

실행해주신 후에 다시 부탁드려요ㅜㅜㅜㅜㅜ

그리고 코랩에서는 실행할 수 없어요.

(코랩이 아니라 로컬의 주피터노트북이라면 괜찮고요.)

윈도우 운영체제에 아래아한글이 설치되어 있는 경우에만

pyhwpx 모듈을 사용하실 수 있습니다.

혹시 spyder로는 안되는 걸까요?

anaconda prompt 에서 conda install --upgrade pyhwpx

설치하고 / 컴퓨터에 한글도 설치되어 있습니다.

 

하고나서

from pyhwpx import Hwp

 

hwp = Hwp()

 

hwp.open_pdf("B project pdf example.pdf")

 

실행했는데 No module named 'pyhwpx' 가 뜨네요 ㅠ

일코님의 프로필 이미지
일코
지식공유자

윈도우 운영체제라면 아무 에디터나 IDE라도 괜찮습니다.

 

다만, conda로 설치하지 마시고,

pip install pyhwpx로 설치하셔야 합니다.

감사합니다!

금기문님의 프로필 이미지
금기문

작성한 질문수

질문하기