인프런 커뮤니티 질문&답변

tkddbs7279님의 프로필 이미지
tkddbs7279

작성한 질문수

[개정판] 파이썬 머신러닝 완벽 가이드

군집화 성능 평가 - 실루엣 분석 실습

실루엣 값을 기준으로 필터한 값을 target값으로 선정

작성

·

193

0

안녕하세요. 교수님.

이번 강의를 보면서 실루엣 값과 각 군집의 평균값에 대개 배웠는데요. 이렇게 구해진 각 값들의 실루엣 계수들에 대해 어느정도 값을 기준으로 필터링하여 해당 클러스터된 각 데이터를 target 값으로 사용하여 다른 데이터의 회귀분석 예측모델을 사용하려는 생각을 조금 해보았는데 이런 진행 방식이 맞는걸까요?

답변 1

0

권 철민님의 프로필 이미지
권 철민
지식공유자

안녕하십니까,

음, 제가 질문을 잘 이해하지 못했습니다.

질문 하신 내용을 좀 더 상세히 기재해 주시겠습니까? 어떤 값을 피처로 하고, 어떤 값을 Target으로 해서 회귀 모델을 적용하고자 하시는 지요?

 

tkddbs7279님의 프로필 이미지
tkddbs7279
질문자

분류 예측을 하였을 때, Target 값이 정해지지 않은 데이터에서

1차로 특정 설문에 대한 군집분석을 통한 분류된 값을 Target값으로 가집니다. 데이터에서 실루엣값이 좀 높은 기준을 가지고 필터링하여 해당 데이터가 target으로 가집니다.

이제 학습할 데이터는 1차로 군집분석한 피처의 데이터가 있지는 않지만 1차에서 필터링한 데이터의 설문데이터가 아닌 성별 나이 등 이런 피쳐를 통해 군집분석된 target 값을 가지고 학습합니다.

최종적으로 설문 데이터가 없는 데이터의 성별 나이 등의 데이터를 통해 target 값을 예측하려는 방식입니다.

권 철민님의 프로필 이미지
권 철민
지식공유자

이제 학습할 데이터는 1차로 군집분석한 피처의 데이터가 있지는 않지만 1차에서 필터링한 데이터의 설문데이터가 아닌 성별 나이 등 이런 피쳐를 통해 군집분석된 target 값을 가지고 학습합니다.

=> 여기가 잘 이해가 안되는 군요.

군집 분석을 특정 피처로 해서 Target값을 가졌는데, 해당 Target 값을 그대로 두고, 기존 피처는 없애고, 새로운 피처들로 학습을 하겠다는 의미 인지요?

그리고, 이런 방식과 더불어 최종 회귀 모델은 어떻게 만들려고 하시는 건지요?

tkddbs7279님의 프로필 이미지
tkddbs7279

작성한 질문수

질문하기