인프런 커뮤니티 질문&답변

jh220307님의 프로필 이미지
jh220307

작성한 질문수

파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)

크롤링할 페이지가 없는 경우 확인 방법과 여러 페이지 한번에 크롤링하는 기법 (업데이트)

여러페이지 크롤링

작성

·

177

·

수정됨

0

- 본 강의 영상 학습 관련 문의에 대해 답변을 드립니다. (어떤 챕터 몇분 몇초를 꼭 기재부탁드립니다)
- 이외의 문의등은 평생강의이므로 양해를 부탁드립니다
- 현업과 병행하는 관계로 주말/휴가 제외 최대한 3일내로 답변을 드리려 노력하고 있습니다
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

section 5 여러페이지 크롤링하기 / 11분쯤에

data = soup.select('h4-card-text')

는 실행되는데

data = soup.find_all('h4-card-text')은 출력이 안됩니다

왜 그럴까요..?

답변 1

0

안녕하세요. 답변도우미입니다.

각 메서드마다 사용법이 다릅니다.

soup.select()soup.find_all() 메소드는 비슷한 기능을 수행하지만, 사용하는 방식에 차이가 있습니다. 여기서 언급된 메소드들은 BeautifulSoup 라이브러리를 사용하는 HTML 또는 XML 문서를 파싱하기 위한 Python 코드의 일부입니다.

- soup.select(selector) 메소드는 CSS 선택자를 사용하여 문서에서 요소를 찾습니다. 예를 들어, 클래스 이름, id, 태그 이름 등을 사용하여 요소를 선택할 수 있습니다. 따라서 'h4-card-text'와 같은 선택자를 사용하려면, 실제 CSS 클래스를 찾으려면 .h4-card-text (클래스를 의미하는 점(.)을 사용) 혹은 #h4-card-text (id를 의미하는 샵(#)을 사용)와 같이 사용해야 합니다.

- soup.find_all(name, attrs) 메소드는 태그 이름과 선택적으로 태그의 속성을 사용하여 문서에서 모든 일치하는 요소를 찾습니다. 첫 번째 인자는 태그 이름이고, attrs 인자를 사용하여 속성으로 필터링할 수 있습니다.

그래서, 각 사용법을 여러 챕터에서 설명을 드리고 있어서요. 사용법을 다시 한번 확인해보시면 도움이 되실 것 같습니다.

감사합니다.

jh220307님의 프로필 이미지
jh220307

작성한 질문수

질문하기