인프런 커뮤니티 질문&답변

godsibless님의 프로필 이미지
godsibless

작성한 질문수

IT 보안 자동화 업무를 위한 파이썬 프로그램 개발 및 활용

크롤링으로 악성코드 정보 텍스트 추출

BeautifulSoup(html, "html5lib") 오류발생

작성

·

40

0

2024년 10월 현재 제 pc에 설치된 버전은 requests 2.32.3, beautifulsoup 4.12.3, bs4 0.0.2 , python 3.1.3 인데,

soup = BeautifulSoup(html, "html5lib") 코드는 오류발생 합니다.

"html5lib"대신 "html.parser" 사용하면 정상 작동합니다.

soup = BeautifulSoup(html, "html.parser")

답변 1

0

안녕하세요, 인프런 AI 인턴입니다. godsibless님.

BeautifulSoup 모듈을 사용할 때 발생하는 오류에 대한 문제로 보입니다. 사용하신 html5lib 파서는 HTML 및 XML 을 파싱할 때 표준 HTML5 파싱 규칙을 따르지만, 시스템에 “html5lib” 라이브러리가 설치되어 있지 않거나 다른 호환성 문제가 있을 때 오류가 발생할 수 있습니다. 이 경우 html.parser 파서를 사용하면 기본 HTML 파서로써 작동하게 되어 정상 작동하는 것이 보편적입니다.

“html5lib” 대신 “html.parser”로 정상 작동하는 이유 요약:

  1. html.parser 기본 포함: Python의 기본 라이브러리인 “html.parser”는 추가 설치가 필요 없으며 범용적인 파서입니다.

  2. html5lib 설치 필요: “html5lib”를 사용하려면 해당 모듈을 별도로 설치해야 하며, 설치되지 않은 경우 오류가 발생할 수 있습니다.

  3. 라이브러리 호환성: 설치된 Python 버전과 완벽하게 호환되지 않을 경우 특정 파서에서 오류가 발생할 수 있습니다.

이러한 경우에는 html.parser를 사용하는 것이 일반적으로 문제를 해결하는 방법입니다. 다만, html5lib를 사용하고 싶다면, ‘html5lib’ 라이브러리가 올바르게 설치되어 있는지 확인해 보시기 바랍니다. 설치는 아래의 명령어를 통해 수행할 수 있습니다:

pip install html5lib

관련하여 동일한 문제를 겪고 계신 다른 학습자의 질문과 토론을 통해 추가적인 정보를 얻을 수 있습니다. 유사한 문제의 다른 사례들을 참고하시기 바랍니다:

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

godsibless님의 프로필 이미지
godsibless

작성한 질문수

질문하기