인프런 커뮤니티 질문&답변

hhs0995님의 프로필 이미지
hhs0995

작성한 질문수

[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)

텍스트를 포함하는 태그 찾기 (feat.정규표현식)

쿠팡 사례처럼 다른 사이트에서 User-Agent로 크롤링이 불가능한 경우

작성

·

569

0

안녕하세요. 혹시

이번 쿠팡 사례처럼 다른 사이트에서 User-Agent로 크롤링이 불가능한 경우 header 선언을 저렇게 해주셨는데, 다른 사이트에서도 만약 User-Agent 로 크롤링이 불가능한 경우 header을 어떻게 선언해야 하는건지 알 수 있을까요?

 

뭔가 규칙이 있는건지, 그냥 구글링해서 가져와야 하는건지요 ㅠㅠ?

답변 1

0

스타트코딩님의 프로필 이미지
스타트코딩
지식공유자

결론부터 말씀드리면,

header를 작성하는 규칙이 따로 정해져 있지는 않습니다 ㅎㅎ

 

서버 개발자 입장에서 생각해보면, 규칙이 정해져 있어서

데이터를 Bot들에게 편하게 주면 문제가 생길 수 있겠죠?

 

개발자 도구에서 Request Header 부분을 참고해서

header를 추가해 주시면 됩니다.

 

규칙은 없지만, 보통 탐지하는 옵션들은 정해져 있어요.

  1. User-Agent

  2. Referer

  3. Accept 종류

  4. Autorization 종류

보통 위 4가지를 넣어 주시면 대부분 해결 됩니다.

 

강의 커리큘럼에서

  • requests 실력 업그레이드 (get 요청)

  • requests 실력 업그레이드 (post 요청) 부분을 꼭 학습해 보세요!!

hhs0995님의 프로필 이미지
hhs0995

작성한 질문수

질문하기