작성
·
60
0
데이터 전처리 과정에서 이해되지 않는 부분이 있습니다.
import pandas as pd
import FinanceDataReader as fdr
df_krx = fdr.StockListing('KRX')
df_krx 로 데이터를 확인했습니다.
ㄴ일부 컬럼 (ex.Dept)에 결측치가 있습니다. <- 값이 비어있습니다. Nan 값으로 채워진 것은 아닙니다.
ㄴ이 때 info() 메소드와 df_krx.isnull()로 확인해보면 null값이 없는 것으로 나오고 isnull() 또한 모두 false가 나오는데 원인을 모르겠습니다.
ㄴ이후 to_csv 메소드를 사용하여 파일을 저장한 후 저장한 파일을 읽어왔을 때는 해당 값들이 NaN 값으로 바뀌어 있는데요.
원인이 무엇일까요?
답변 1
0
안녕하세요.
해당 강의 촬영 이후 API 에서 제공하는 데이터의 형태가 달라져서 현재는 결측치가 없이 위와 같은 형태로 보이는게 맞습니다.
수업자료와 함께 제공해 드리는 csv 파일로 실습을 권장드립니다.
또, CSV 파일로 저장했을 때 해당 값이 nan 인 결측치로 보이는 현상에 대해서는 저도 위 코드 외에 추가 코드를 올려주시면 답변을 드리겠습니다.
API 변경으로 이용에 불편을 드려 죄송합니다.
해당 강의는 올해 안에 업데이트 예정입니다.
불편하시더라도 당분간은 기존에 제공된 csv 파일을 사용해서 실습을 해주세요.
감사합니다.