"쿠팡 제품 검색 결과 크롤링" 강의를 응용해서 타오바오 사이트에서 해보려고 하는데,,

Question

"쿠팡 제품 검색 결과 크롤링" 강의를 응용해서 타오바오 사이트에서 해보려고 하는데,

자꾸 안돼서 아래와 같이 print(html) 했더니

뭔가 차단된거 같은 html 막 쭉 뜨네요 이럴때는

어떻게 해야하나요?

req = requests.get(links, timeout=5, headers=headers, cookies=cookie)

html = req.text
soup = BeautifulSoup(html, "html.parser")

print(html)

김플 · Answer

9-2 셀레니움으로 네이버 뷰탭 스크롤해서 크롤링하기
이 강의가 셀레니움으로 접속한 페이지소스를 뷰티풀수프를 사용해 정보를 가져오는 강의입니다.

김플 · Answer

타오바오는 방금 제가 해봤을때 위 코드로 차단없이 잘 실행이 되었습니다.
만약 같은 코드인데 안된다면 아이피가 차단됐을수도 있습니다.
그리고 중요한건,
제가 아이디가 없기때문에 메인페이지만 볼수있어서 다른 페이지는 모르겠지만
일단, 메인페이지가 동적으로 되어있기 때문에 뷰티풀수프와 리퀘스츠만으로는 제품 정보를 가져올수가 없습니다.
셀레니움을 사용해서 직접 화면에 접속을 해서 정보를 가져와야 합니다.
다만, 이건 메인페이지의 경우이고 다른 페이지는 제가 볼수가 없어서 파악을 못했습니다.

인프런 커뮤니티 질문&답변

"쿠팡 제품 검색 결과 크롤링" 강의를 응용해서 타오바오 사이트에서 해보려고 하는데,,