인프런 커뮤니티 질문&답변

최범석님의 프로필 이미지
최범석

작성한 질문수

[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)

텍스트를 포함하는 태그 찾기 (feat.정규표현식)

첫페이지 크롤링에서 For 문까지는 작동이 되네요. 그러나

작성

·

217

0

for 문 내의  soup 를 출력하면  작동이 되는데.

그이후 select_one 을 써서 브랜드 상품명 가격등을 변수에 넣고  출력하면 터미널이 그냥 멈춰 버립니다.

from itertools import product
import requests
from bs4 import BeautifulSoup


main_url = "https://www.coupang.com/np/search?component=&q=%EA%B2%8C%EC%9D%B4%EB%B0%8D+%EB%A7%88%EC%9A%B0%EC%8A%A4"

#헤더에 유저에이전트 추가
response = requests.get(main_url, headers={'User-Agent' : 'Mozila/5.0'})
html = response.text
soup = BeautifulSoup(html, 'html.parser')

links = soup.select("a.search-product-link") 
#print(links)

for link in links :
    sub_url = "https://www.coupang.com/" + link.attrs['href']

    response = requests.get(sub_url, headers={'User-Agent' : 'Mozila/5.0'})
    html = response.text
    soup = BeautifulSoup(html, 'html.parser')
    # print(soup).text

    #브랜드명
    # brand_name = soup.select_one("a.prod-brand-name").text
    # #상품명
    # product_name = soup.select_one("h2.prod-buy-header__title").text
    # #가격
    product_price = soup.select_one("span.total-price > strong")

    # print(brand_name, product_name ,product_price)
    print(product_price)

결과물은 

Microsoft Windows [Version 10.0.22000.556]
(c) Microsoft Corporation. All rights reserved.

D:\python\startcoding>C:/Users/iam6e/AppData/Local/Programs/Python/Python310/python.exe "d:/python/startcoding/실전편/03.쿠팡크롤링/01_첫번째 페이지 크롤링.py"

 

이렇게 그냥 아무것도 동작하지 않고 터미널을 닫아야만 해요 ㅠㅜㅜ 어떻게 해야 할까요?

 

 

답변 1

0

스타트코딩님의 프로필 이미지
스타트코딩
지식공유자

쿠팡 사이트에서 업데이트가 있었나 보네요.

 

제가 확인 후 답변드리고,

해당강의내용 수정하겠습니다.

 

우선, 다른 예제 부터 진행해 보세요 :)

최범석님의 프로필 이미지
최범석

작성한 질문수

질문하기