해결된 질문
작성
·
772
0
답변 1
0
안녕하십니까,
저도 선형회귀를 처음 배울때 독립 변수들끼리 상관도가 높으면 제거를 고려하라고 배웠지만, 실제는 그닥 성능이 향상되지 않거나 오히려 저하되는 경우가 있었습니다.
피처엔지니어링 중에 피처 셀렉션, 그러니까 적절한 피처만 고르는 작업을 수행시 오히려 성능이 향상되지 않는 경우가 발생하곤 합니다.
꼭 이론대로 모델이 움직이지 않습니다. 특히 선형회귀에서 다중공선성이 그런 특성이 있는 것 같습니다.
다중공선성으로 피처를 제거하는 것은 보조적인 수단으로 참고하시면 좋을 것 같습니다. 한번 제거해 보고, 성능이 나빠지면 다시 원복하는 수준에서 테스트 해보시면 좋을 것 같습니다. 개인적으로 선형 규제 회귀에서 다중 공선성 이슈로 피처를 제거해서 성능이 좋아지는 경우를 많이 경험해 보지 못했습니다.
요약해서 말씀 드리면 다중 공선성 이슈는 이론대로 모델이 작동하는 경우가 그렇게 흔하지 않으며, 독립변수를 제거했다가 오히려 성능이 저하되는 경우가 발생할 수도 있습니다. 보조적으로 적용해보고, 성능이 저하되면 적용하지 않으시는게 좋다고 생각합니다.
감사합니다.