인프런 커뮤니티 질문&답변

Jeong JongHyun님의 프로필 이미지

작성한 질문수

파이썬 입문 및 웹 크롤링을 활용한 다양한 자동화 어플리케이션 제작하기

BeautifulSoup 사용법 및 간단 웹 파싱 실습(1) - 네이버, 다음, 인프런

다음 금융 싸이트 스크래핑 예제 질문2

작성

·

151

0

우선 스크래핑 할려는 부분은 다음과 같습니다.

http://finance.daum.net/

다음 금융 싸이트 들어가시면 우측 하단 카테고리 중에 '시가총액' 을 눌러야 활성화되서

시가총액 리스트 나오는 부분을 스크래핑 할려고 합니다.

알려주신대로 개발자도구 활용해서 copy->selector를 하니

boxMarketTrend > div.box_contents > div:nth-child(6) > div.halfB.fr > ul > li:nth-child(1) > a

위와 같은 내용으로 나와서 실제 소스에 붙여 놓고 실행을 해봤을 때는 빈값을 가져오게 됩니다..

boxMarketTrend

태그만 실행했을때는 정상적으로 데이터를 가져오고

boxMarketTrend > div.box_contents

를 실행했을 때는 데이터를 못가져오는데요..

어떤 방법으로 해결해야할지 질문드립니다..

답변 3

0

좋은사람님의 프로필 이미지
좋은사람
지식공유자

https://try.jsoup.org/

위와 같은 서비스를 제공하는 사이트 입니다.

참고로 정말 많은 사이트가 있으므로, 기능과 ui 등을 살펴보신 후 본인에게 맞는 걸로 학습하시면 됩니다.

https://www.google.co.kr/search?q=online+css+selector&oq=online+css+sele&aqs=chrome.0.0j69i57j0l4.5287j0j8&sourceid=chrome&ie=UTF-8

0

답변 감사드립니다.

답변 내용중에

'수업 중에 css선택자를 활용하는 온라인 사이트 주소'

라는게 어느 사이트를 말씀하시는 건지요?

0

좋은사람님의 프로필 이미지
좋은사람
지식공유자

안녕하세요. 종현님

제가 직접 스크랩핑 코드를 알려드리는 것은 정책에 맞지 않아 양해 부탁드려요 ㅠ.ㅠ

지금 카피한 것은 xpath를 카피 한 것입니다.

그대로 bs4 에 선택자로 활용하면 당연히 빈 값(엘리먼트)이 나오게 됩니다.

해당 xpath를 보시고 저 부분에 맞게 선택자로 변환해야 합니다.

이 부분에서는 css 기초 학습이 필요합니다. 수업중에 css 선택자를 활용하는 온라인

사이트 주소에 가셔서 다음 금융 정보 전체 소스를 복사해서 해당 부분의 선택자를 정확하게

선택하셔서 매개변수로 넣어줘야 해당 엘리먼트의 주식 값을 가져오게 되겠죠?

CSS 강의를 한 무료로 들어보시고 다시 보시면 금방 해당 엘리먼트의 값을 파싱할 수 있을 것 입니다.