인프런 커뮤니티 질문&답변

Nosugar님의 프로필 이미지
Nosugar

작성한 질문수

[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)

N번째 태그만 선택하기

response.get 질문입니다.

작성

·

240

1

안녕하세요. 개인적으로 스크래핑 기술로 간단한 앱을 만들어보고 싶어서 이 강좌를 수강하고 있습니다. response.get 으로 스크래핑이 제대로 실행이 되지 않는 사이트들도 있나요?

이를 테면, 밑의 코드를 보면 프린트 값이 빈 [] 이거나 아무값이 표시되지 않습니다. 이러한 경우에는 어떻게 해야하나요?

import requests
import pyautogui
from bs4 import BeautifulSoup

# keyword = pyautogui.prompt('USE YOUR HEAD AND SEARCH IT.')

# response = requests.get(f"https://search.naver.com/search.naver?where=news&ie=utf8&sm=nws_hty&query={keyword}")
response = requests.get("https://www.fromjapan.co.jp/en/item/search/kaptain+sunshine/Al_11_Yh_RaSuBpOmRm_N_N_0A00ja00_N/lgk-link_top_search")
html = response.text
soup = BeautifulSoup(html, "html.parser")

items = soup.select(".shop-item")
print(items)
for item in items:
    print(item)

답변 2

1

스타트코딩님의 프로필 이미지
스타트코딩
지식공유자

안녕하세요!

동적인 페이지에서는 requests + bs4 조합으로 크롤링이 되지 않습니다.

동적인 페이지 크롤링 방법은 남은 강의에서 배울 수 있는데

selenium을 이용하거나, 네트워크 분석을 통해 동적으로 일어나는 요청을 찾아 내는 방법이 있습니다.

남은 강의를 공부하시면 해결할 수 있을 겁니다 ^^

0

Nosugar님의 프로필 이미지
Nosugar
질문자

답변감사드립니다. 킵고잉 하겠습니다.ㅎ

 

Nosugar님의 프로필 이미지
Nosugar

작성한 질문수

질문하기