작성
·
143
0
import requests
from bs4 import BeautifulSoup
res = requests.get('http://v.media.daum.net/v/20170615203441266')
soup = BeautifulSoup(res.content, 'html.parser')
mydata = soup.find('div',attrs={'class':'layer_body','data-translation':'true'})
print(mydata.get_text())
설명해 주신 것과 같이 크롤링 특성상 자주 형식이 바뀌어 영상 업데이트는 불가능 하다 생각 들지만 수업 자료에 있는 pdf 파일에 그에 맞는 코드는 넣어주셧으면 좋겠습니다!
답변 1
0
안녕하세요. 답변 도우미입니다.
네 근본적으로 이 문제를 해결하기 위해, 다음 사이트등 극히 일부 케이스 외에는 모두 아예 직접 제가 사이트를 만들어서, 이를 기반으로 크롤링 연습을 하실 수 있도록 구성하였습니다. 이후 강의 보시면 이해하실 수 있으실꺼예요.
다음 사이트등 극히 일부 케이스는 실제 사이트라서 더 흥미가 있을 수 있기 때문에, 최대한 안바뀌는 부분으로 넣었는데, 해당 부분도 일부 바뀌었네요. 본 영상과 PDF 부분 수정하였습니다. 바뀐 케이스를 크롤링하는데에는 문법의 난이도가 갑자기 높아졌으므로, 해당 부분은 현 단계에서는 삭제 후, 강의 후반부에 보다 다양한 문법을 익히는 것으로 하였습니다.
감사합니다.