인프런 커뮤니티 질문&답변

홍태경님의 프로필 이미지
홍태경

작성한 질문수

파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

패턴으로 실습하며 익히기: HTML/CSS 이해를 바탕으로 크롤링하기

금융당국 ~ 대출 받는 것이 어려워진다 크롤링 pdf파일 업데이트 부탁 드립니다

작성

·

144

0

import requests
from bs4 import BeautifulSoup



res = requests.get('http://v.media.daum.net/v/20170615203441266')

soup = BeautifulSoup(res.content, 'html.parser')
mydata = soup.find('div',attrs={'class':'layer_body','data-translation':'true'})

print(mydata.get_text())

 

 

설명해 주신 것과 같이 크롤링 특성상 자주 형식이 바뀌어 영상 업데이트는 불가능 하다 생각 들지만 수업 자료에 있는 pdf 파일에 그에 맞는 코드는 넣어주셧으면 좋겠습니다!

 

 

답변 1

0

안녕하세요. 답변 도우미입니다.

네 근본적으로 이 문제를 해결하기 위해, 다음 사이트등 극히 일부 케이스 외에는 모두 아예 직접 제가 사이트를 만들어서, 이를 기반으로 크롤링 연습을 하실 수 있도록 구성하였습니다. 이후 강의 보시면 이해하실 수 있으실꺼예요.

다음 사이트등 극히 일부 케이스는 실제 사이트라서 더 흥미가 있을 수 있기 때문에, 최대한 안바뀌는 부분으로 넣었는데, 해당 부분도 일부 바뀌었네요. 본 영상과 PDF 부분 수정하였습니다. 바뀐 케이스를 크롤링하는데에는 문법의 난이도가 갑자기 높아졌으므로, 해당 부분은 현 단계에서는 삭제 후, 강의 후반부에 보다 다양한 문법을 익히는 것으로 하였습니다.

감사합니다.

홍태경님의 프로필 이미지
홍태경

작성한 질문수

질문하기