소개
게시글
질문&답변
2020.01.28
네이버 크롤링에서 결과값이 나오지 않습니다.
https://www.inflearn.com/questions/21894 위 링크 제 코드 참조
- 0
- 2
- 430
질문&답변
2020.01.28
네이버 크롤링에서 제 코드에서 어떤 문제가 있는지 모르겠어요.
https://www.inflearn.com/questions/21894 위 링크 제 코드 참조
- 1
- 1
- 186
질문&답변
2020.01.20
css관련 질문
스크래피 다루는 이 강의 말고 전 강의 '파이썬입문과 크롤링기초 부트캠프'로 돌아가셔서 저 부분 참고하세요. 크롬에서 F12 눌러서 CSS SELECTOR 복사 해서 붙여넣기하면 안되는 경우가 훨씬 더 많으니깐, 아래 강의 보시면 차례대로 상위 태그에서 하위 태그로 줌-인해서 원하는거만 빼낼 수 있는 방법 알려줍니다. 하위에서 상위로 가는 반대도 알려주고요. (사진) (사진) import requests from bs4 import BeautifulSoup html = ' \ \ 저는 그다지 잘해서 그린때문에 어느 그림을 사진에 \ \ \ "저는 그다지 잘" \ ... \ 못 \ "그"\ ... \ 려서 \ "어느 그림을 사진에" \ \ \ ' soup = BeautifulSoup(html, "html.parser") data= soup.select('ul.correction_field p') for item in data: print(item.get_text().strip())
- 0
- 1
- 250
질문&답변
2020.01.18
질문이 있습니다~
새롭게 켜서 다시 해보세요. 저는 잘 되는데 노트북 다시 시작하고 그 새로고침 버튼 같이 생긴 커널 재시작인가 그거 한번 눌러보세요 (사진)
- 0
- 1
- 146
질문&답변
2020.01.18
실전 크롤링과 강력한 크롤링 기술 팁2: 네이버 사이트 크롤링 강의중 질문이 있습니다.
안녕하세요. 윗분 말씀대로 실시간 관련 소스는 저 부분이 전부입니다. 그래서 www.naver.com 말고 급상승 검색어를 클릭하시고 DataLab 페이지로 들어가세요. 그리고 F12 클릭하시면 실시간 검색어 순위가 나타날텐데요. 거기서 크롤링을 하시면 되겠습니다. 아래 코드를 삽입하시면 작동합니다. 첫번째 코드에 있는 headers 부분은 네이버가 무슨 이유인지 모르겠지만 싸이트에 접속을 못하게 해서 우회용도로 쓰인거라 강의에서 다룬 내용과 같은 코드인 두번재 코드를 삽입해서 작동이 되는지 먼저 확인을 해보시고, 안되면 첫번재 코드를 넣어서 작동시켜 보시길 바랍니다. (사진) (사진) (사진) 첫번째 코드 import requests from bs4 import BeautifulSoup headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36'} url = 'https://datalab.naver.com/keyword/realtimeList.naver?where=main' res = requests.get(url, headers = headers) soup = BeautifulSoup(res.content, 'html.parser') data = soup.findAll('span','item_title') for item in data: print(item.get_text()) 두번째 코드 res1 = requests.get('https://datalab.naver.com/keyword/realtimeList.naver?where=main') soup1 = BeautifulSoup(res.content, 'html.parser') data1 = soup.findAll('span', 'item_title') for item in data1: print(item.get_text())
- 1
- 4
- 515