작성
·
229
·
수정됨
0
교재 279기준으로 해서 질문이 있습니다
각 모델 1-3부터 예측을 해서 예측에 나온 결과값으로 스태킹을 하는 부분은 이해를 했습니다
하지만 여기 predict를 해서 나온 결과값들이 (암 환자이면 암1 암이 아니면 0) 0,1로 구성된 레이블이 나오는데 이 데이터로 어떻게 학습을 하나요..?
정리하면 기존에 암 데이터 피처는 종양크기, 위치, 색 등으로 피처데이터로 구성되어서 학습하고 예측 했는데
스태킹에서 predict로 나온 결과값들(0,1,1,0 예로 들어) 어떻게 학습을 하게 되는 건가요…?
추가적으로 메타모델이 로지스틱이면 앞선 데이터들로 어떻게 로지스틱 알고리즘을 활용하여 결과를 도축하나요…? 학습과 레이블은 0,1식으로 되어있는데..
감사합니다
답변 1
0
안녕하십니까,
정리하면 기존에 암 데이터 피처는 종양크기, 위치, 색 등으로 피처데이터로 구성되어서 학습하고 예측 했는데스태킹에서 predict로 나온 결과값들(0,1,1,0 예로 들어) 어떻게 학습을 하게 되는 건가요…?
=> 스태킹 메타 모델의 학습을 정리하자면 학습 피처들을 학습한 여러개의 모델들의 예측한 결과 패턴을 다시 학습하여 최종적인 예측 결과를 도출하는 것이라고 생각해주시면 될 것 같습니다.
그래서 예측 결과들을 메타 모델을 위한 학습 데이터로 다시 만드는 것입니다.
추가적으로 메타모델이 로지스틱이면 앞선 데이터들로 어떻게 로지스틱 알고리즘을 활용하여 결과를 도축하나요…? 학습과 레이블은 0,1식으로 되어있는데..
=> 음, 이건 질문을 잘 이해하지 못했습니다. 학습과 레이블이 0, 1 식으로 되어 있는데 왜 로지스틱 알고리즘이 적용이 안되는 이유가 없어 보입니다만,
머신러닝 데이터는 숫자형이기만 하면 다 학습과 레이블 데이터로 사용될 수 있습니다.
원하시는 답변이 아니면 다시 글 부탁드립니다.
감사합니다.
감사합니다