인프런 커뮤니티 질문&답변

감성훈님의 프로필 이미지

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

다항회귀(Polynomial Regression)의 이해와 다항회귀를 이용한 보스턴 주택가격 예측

polynomial feature 관련 질문

21.10.01 00:04 작성

·

167

0

안녕하세요. 다항회귀 관련해서 이해되지 않는 것이 있어 질문드립니다. 

교재와 강의에서 일차 단항식 계수를 PolynomialFeatures 클래스를 활용하여 삼차 다항식 계수로 변환한뒤, Linear Regression을 통해 선형회귀를 적용하여 다항 회귀를 구현한다고 하셨습니다. 

그럼 결국 다항 회귀를 하려면 일차 단항식 계수가 주어져야 하는지 의문이 있습니다. 예제의 경우 X=np.arange(4).reshape(2,2)를 통해 단항식 행렬이라 가정했는데, 일반적으로 데이터가 주어졌을 때 다항회귀를 할 경우 이러한 단항식 행렬이 주어져지 않습니다. 그러면 어떻게 다항회귀를 할 수 있는건지 이해가 되지 않습니다. 

 

정리해보자면, 다항회귀의 첫 단계에서 나오는 단항식 계수가 어떤 의미를 가지고 있고, 어떻게 구해야 하는건지 알고 싶습니다.

감사합니다.

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

2021. 10. 01. 22:12

안녕하십니까,

다항 계수를 설명 드리기 위해서 X=np.arange(4).reshape(2,2)를 이용하였지만 결국은 Polynomial Feature를 만드는 것입니다. 그러니까 X가 학습 Feature 데이터라면 이를 이용하여 새로운 Polynomial 용 학습 feature를 만드는 것입니다. 

가령 2개의 feature로 되어 있는 100개의 학습 데이터 X가 있다면 이를 10개의 Polynomial Feature로 되어 있는  100개의 학습데이터로 변환하고 이를 Linear Regression에 적용하는 것이 사이킷런의 다항 회귀 입니다. 

감사합니다.