작성
·
191
0
안녕하세요, 선생님. 좋은 수업 제공해주셔서 감사합니다. 프로그램 처음 시작해서 48강까지 온 제가 너무 신기하네요. 감사합니다. 다름이 아니라 기사가 업데이트 되었는지, 강의에서 보이는 기사의 페이지소스와 제 크롬에서 보이는 페이지소스가 달라 헷갈려서 질문 드립니다. 기사 입력날짜를 크롤링하려고 아래와 같이 했는데요. 출력이 기사입력날짜, 좋아요,댓글달기, 0,0 등이 나와서요. 어떤 부분을 수정해야할지 잘모르겠습니다.
제가 쓴 코드
import requests
from bs4 import BeautifulSoup
res = requests.get('https://www.hankookilbo.com/News/Read/201706152032519127')
soup = BeautifulSoup(res.content, 'html.parser')
mydata = soup.find_all ('div','info')
for item in mydata :
print (item.get_text())
제 크롬에서 본 페이지소스
</div> | |
<h2 class="title"> | |
잔금대출에도 DTI 규제 적용 검토</h2> | |
<div class="info"> | |
<dl> | |
<dt>입력</dt> | |
<dd>2017.06.15 20:09</dd> | |
</dl> | |
<div class="tool-bar"> | |
<!-- .tooltip-box --> | |
<div class="tooltip-box"> | |
<button type="button" class="btn-like-all open-tip"> | |
<span class="blind">좋아요</span> | |
</button> | |
<!-- .like-detail --> | |
<div class="like-detail tooltip"> | |
<ul> | |
<li class="like" id="likeCntLi">0</li> | |
<li class="unlike" id="dislikeCntLi">0</li> | |
</ul> | |
</div> | |
<!-- // .like-detail --> | |
</div> | |
<!-- // .tooltip-box --> | |
<span class="count" id="sympathyCntSpan">0</span> | |
<button type="button" class="btn-comment"> | |
<span class="blind">댓글달기</span> | |
</button> | |
<span class="count" id="commentCntSpan">0</span> | |
</div> | |
</div> | |
</div> | |
답변 3
0
답변 감사합니다~ 선생님. "패턴으로 실습하며 익히기 : HTML/CSS 이해를 바탕으로 크롤링하기" 강좌 보고 질문 드렸었습니다. 질문드리고서 해당 강의 다음에 있는 강의들을 보니, 제 질문에 대한 해답들이 다 있어서 질문 안 드렸어도 될뻔했어요 ㅎㅎㅎ 강의 최고입니다! 감사합니다!
0
강의에서 크롤링한 주소가 아니고, 한국일보에서 크롤링하셔서 차이가 있는것 같네요.
제가 도움을 드리자면 아래의 코드를 그대로 해보시면 될거에요..
기존에 작성하신 코드와 비교해 보시면 될듯해요.
import requests
from bs4 import BeautifulSoup
res = requests.get('https://www.hankookilbo.com/News/Read/201706152032519127')
soup = BeautifulSoup(res.content, 'html.parser')
mydata = soup.select_one ('div.info dd')
print (mydata.get_text())
0
안녕하세요. 강의를 잘 들어주셔서 감사합니다. 또 응원합니다.
그런데 크롤링 주소가 이것으로 되어 있고요, 강의 어느 부분에서 어떤 부분을 말씀하시는 것인지 잘 이해가 안가서요. 강의에서는 다음 뉴스를 크롤링하니까요.
https://www.hankookilbo.com/News/Read/201706152032519127
새로운 질문으로 (댓글에 댓글은 제가 찾기가 어려워서요) 강의 어느 부분에서, 어떤 코드를 가지고, 어떤 부분이 강의와 다르게 동작하는지 한번 확인부탁드려도 될까요???
감사합니다.