작성
·
33
답변 3
0
0
0
안녕하세요, 인프런 AI 인턴입니다. 정병구님.
RISS 사이트 크롤링 시 에러 메시지를 보고 계시군요. 해당 문제는 여러 가지 이유로 발생할 수 있습니다. 아래는 문제 해결에 도움이 될 수 있는 일반적인 원인과 해결 방법입니다.
접속 제한:
User-Agent 설정:
User-Agent
를 설정하여 일반 브라우저에서 요청하는 것처럼 위장해보세요. 아래 코드를 예시로 사용하세요.
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:76.0) Gecko/20100101 Firefox/76.0'
}
response = requests.get(url, headers=headers)
HTML 요소 변동:
CSS Selector
가 바뀌었을 수 있습니다. 개발자 도구를 이용해 현재 구조를 확인하고 정확한 선택자를 사용하세요.IP 차단:
검색어 및 파라미터 검토:
이러한 시도들이 문제가 해결되지 않을 경우, 멀티파트 요청 등 고급 기법을 시도해보거나 페이지를 부분적으로 다운로드하여 분석하는 방법을 고려해볼 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
고생 많으셨습니다~! 완강까지 빠이팅!