인프런 커뮤니티 질문&답변

SeongJun Jeong님의 프로필 이미지
SeongJun Jeong

작성한 질문수

현존 최강 크롤링 기술: Scrapy와 Selenium 정복

css관련 질문

작성

·

250

0

안녕하세요!

<p>...</p> 안에 있는 모든 텍스트와, 하위 클래스의 텍스트를 가져올려면 어떻게 해야하나요??

#journal_comment_279780214383945048857931676069855610723 > div.little-spaced.mb_10.single_comment_box.show_report_spam_link.cfx > div.correction_list.corner-rounded_5.little-spaced > div:nth-child(3) > ul > li.corrected.correct > p

t감사합니다!

답변 1

0

스크래피 다루는 이 강의 말고 전 강의 '파이썬입문과 크롤링기초 부트캠프'로 돌아가셔서 저 부분 참고하세요. 크롬에서 F12 눌러서 CSS SELECTOR 복사 해서 붙여넣기하면 안되는 경우가 훨씬 더 많으니깐, 아래 강의 보시면 차례대로 상위 태그에서 하위 태그로 줌-인해서 원하는거만 빼낼 수 있는 방법 알려줍니다. 하위에서 상위로 가는 반대도 알려주고요.

import requests

from bs4 import BeautifulSoup

html = '<div class = "correction_box"> \

            <ul class = "correction_field"> \

                <li class = "incorrect"> 저는 그다지 잘해서 그린때문에 어느 그림을 사진에</li> \

                <li class = "corrected correct"> \

                    <p>\

                        "저는 그다지 잘" \

                        <span class = "f_gray">...</span> \

                        <span class = "f_red">못</span> \

                        "그"\

                        <span class = "f_gray">...</span> \

                        <span class = "f_red">려서</span> \

                        "어느 그림을 사진에" \

                    </p> \

                </ul> \

        </div>'

    

soup = BeautifulSoup(html, "html.parser")

data= soup.select('ul.correction_field p')

for item in data:

    print(item.get_text().strip())

SeongJun Jeong님의 프로필 이미지
SeongJun Jeong

작성한 질문수

질문하기