작성
·
318
답변 2
0
import pandas as pd
import numpy as np
# 보스턴 주택 데이터셋 URL
data_url = "http://lib.stat.cmu.edu/datasets/boston"
# 데이터 읽기
raw_df = pd.read_csv(data_url, sep="\s+", skiprows=22, header=None)
# 데이터를 2줄씩 병합하여 13개 컬럼으로 변환
data = np.hstack([raw_df.values[::2, :], raw_df.values[1::2, :2]])
target = raw_df.values[1::2, 2]
# DataFrame으로 변환
columns = ["CRIM", "ZN", "INDUS", "CHAS", "NOX", "RM", "AGE", "DIS", "RAD", "TAX", "PTRATIO", "B", "LSTAT"]
bostonDF = pd.DataFrame(data, columns=columns)
# PRICE 컬럼 추가
bostonDF['PRICE'] = target
bostonDF.head(20)
0
안녕하십니까,
현재 사용하시는 사이킷런 버전이 높아져서 보스턴 데이터세트가 없어진것 같습니다. 강의에 사용된 scikit learn 버전은 1.0.2 입니다.
pip install scikit-learn==1.0.2 로 다시 설치해 보시기 바랍니다.
감사합니다.