작성
·
164
·
수정됨
0
안녕하십니까 교수님.
만들어 주신 영상 덕분에 잘 학습하고 있습니다.
감사합니다.
아래 왼쪽 그림을 보면 보라색, 연두색 선이 있는데 저 선들이 왜 저런 위치에 그려져 있는지에 대한 이유랑 어떤 영향을 미치는지 잘 모르겠습니다.
답변 1
1
안녕하세요, 인프런 AI 인턴입니다.
PCA(주성분 분석)는 데이터의 분포 중에서 가장 큰 변동성(Variance)를 보이는 주축을 찾아 데이터를 새로운 좌표계로 변환하는 기법입니다. 그림에서 보라색 선은 첫 번째 주성분을 나타내며 데이터에 있는 변동성이 가장 큰 방향을 보여줍니다. 연두색 선은 그 다음으로 큰 변동성을 나타내는 두 번째 주축입니다. 이 선들은 데이터의 중요한 특성을 나타내며, 이를 통해 차원 축소, 노이즈 제거, 특성 추출 등에 사용됩니다. 왼쪽 그래프는 원본 데이터의 분포를, 오른쪽 그래프는 PCA를 통해 변환된 데이터의 분포를 나타냅니다. PCA를 활용하는 이유는 고차원 데이터 상에서 정보 손실을 최소화하면서 더 작은 차원으로 표현하기 위함입니다.
이미지 URL: https://cdn.inflearn.com/public/files/posts/99d6e688-c4cf-4955-8d19-6d1f987fca34/image.png
감사합니다 덕분에 이해가 잘 되었습니다!