묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결파이썬 무료 강의 (활용편3) - 웹 스크래핑 (5시간)
URL 문제
URL에 있는 Page 정보를 이용해서 여러 Page에 걸쳐진 정보를 스크래핑 하는 것으로 알고 있습니다. 그런데 일부 사이트에서는 Page를 옮겨도 URL이 전혀 변경되지 않고, 고정으로 있었습니다. 이런 경우엔 어떻게 해결하나요? 개발자 도구에 페이지 정보가 들어있는 URL 정보가 따로 있는지요?
-
미해결파이썬 증권 데이터 수집과 분석으로 신호와 소음 찾기
Yahoo Finance에서 URL 가져오기
이 강의를 듣고 나면 네이버금융 뿐만 아니라 다른 웹 스크래핑도 가능할 것이라 하셨는데, 처음부터 너무 막히니 속상하네요. 스크립트는 다음과 같습니다. import pandas as pdfrom bs4 import BeautifulSoup as bs url = f"https://finance.yahoo.com/quote/YM%3DF/history?p=YM%3DF"table = pd.read_html(url)response = requests.get(url, headers = headers)html = bs(response.text)table = html.select("table")temp = pd.read_html(str(table))temp[0] 여기서 url부터 인식을 못하고 HTTPError가 뜹니다. 해결방법이 있을까요? HTTPError: HTTP Error 404: Not Found