해결된 질문
작성
·
503
·
수정됨
1
이렇게 코드 작성을 했는데, 강의와는 다르게 출력이 안되네요 현재 강의는 쿠팡 크롤링의 [상품 링크, 썸네일 url 가져오기] 이고, 시점은 04:14 입니다. 강의 영상 내 html하고 지금 쿠팡 html 하고 비교도 해봤는데 틀린 것이 없고 오타도 없는 것 같은데 문제가 뭘까요 ?
import requests
from bs4 import BeautifulSoup
headers = {
"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36", "accept-language": "ko-KR,ko;q=0.9,en-US;q=0.8,en;q=0.7"
}
cookie = {"a" : "b"}
base_url = "https://www.coupang.com/np/search?component=&q="
keyword = input("검색어 입력하세요 : ")
search_url = base_url + keyword
req = requests.get(search_url, timeout=5, headers=headers, cookies=cookie)
html = req.text
soup = BeautifulSoup(html, "html.parser")
items = soup.select("[class=search-product]")
print(len(items))
rank = 1
for item in items:
badge_rocket = item.select_one(".badge.rocket")
if not badge_rocket:
continue
name = item.select_one(".name")
price = item.select_one(".price-value")
thumb = item.select_one("search-product-wrap-img")
link = item.select_one("a")["href"] # or item.a["href"]
print(f"{rank}위")
print(name.text)
print(f"{price.text} 원")
# print(link)
print(thumb["src"])
print()
rank += 1
결과는 이렇게 뜨네요
쿠팡 html 입니다.
답변 1
1
에러 메세지를 잘 보시면 어디에 문제가 있는지 알 수 있습니다.
print(thumb["src"])에 문제가 있다고 표시되죠?
그렇다는건 thumb에 문제가 있다는건데
thumb = item.select_one("search-product-wrap-img")
여기에 강의와 달리 클래스 이름앞에 .이 빠져있습니다.
아, 이 기초적인 걸 ㅠㅠ 또 실수를 해버렸네요
감사합니다.