작성
·
250
0
안녕하세요!
<p>...</p> 안에 있는 모든 텍스트와, 하위 클래스의 텍스트를 가져올려면 어떻게 해야하나요??
#journal_comment_279780214383945048857931676069855610723 > div.little-spaced.mb_10.single_comment_box.show_report_spam_link.cfx > div.correction_list.corner-rounded_5.little-spaced > div:nth-child(3) > ul > li.corrected.correct > p
t감사합니다!
답변 1
0
스크래피 다루는 이 강의 말고 전 강의 '파이썬입문과 크롤링기초 부트캠프'로 돌아가셔서 저 부분 참고하세요. 크롬에서 F12 눌러서 CSS SELECTOR 복사 해서 붙여넣기하면 안되는 경우가 훨씬 더 많으니깐, 아래 강의 보시면 차례대로 상위 태그에서 하위 태그로 줌-인해서 원하는거만 빼낼 수 있는 방법 알려줍니다. 하위에서 상위로 가는 반대도 알려주고요.
import requests
from bs4 import BeautifulSoup
html = '<div class = "correction_box"> \
<ul class = "correction_field"> \
<li class = "incorrect"> 저는 그다지 잘해서 그린때문에 어느 그림을 사진에</li> \
<li class = "corrected correct"> \
<p>\
"저는 그다지 잘" \
<span class = "f_gray">...</span> \
<span class = "f_red">못</span> \
"그"\
<span class = "f_gray">...</span> \
<span class = "f_red">려서</span> \
"어느 그림을 사진에" \
</p> \
</ul> \
</div>'
soup = BeautifulSoup(html, "html.parser")
data= soup.select('ul.correction_field p')
for item in data:
print(item.get_text().strip())