해결된 질문
작성
·
224
답변 1
1
규다님, 안녕하세요! 열공하고 계시네요!🔥
부탁 하나 드릴게요:) 해당 과정의 질의응답은 '1:1 멘토링'이 아닌 '공개'형태입니다.
따라서 수강하는 다른 분들도 함께 보고 학습할 수 있도록 질문코드를 공유해줄 때는 제게만 공개하는 방식 말고 모두에게 공개 부탁드립니다. 또는 본문 내용에 담아주셔도 좋습니다. 🙏
그리고 질문이 구체적이면 자세한 답변이 가능할 것 같아요
저도 좋은 답변을 달고자 함이오니 부탁드리겠습니다 👍
안녕하세요!
공개로 전환 했습니다. (방법을 모르고 있다가 이번에 알게 되었네요 : ▷ )
1) corr() 함수를 통해 주관적으로 유사성이 있다고 판단되는 '총구매액', '최대구매액', '환불금액' 피쳐 중에서 강한 상관관계를 나타내는 최대구매액을 제외한 나머지 피쳐는 아예 삭제처리하고 모델링을 진행했는데요. 이렇게 진행해도 되는건지 확신이 안섭니다.
2) x_train과 x_test 데이터에서 '주구매상품' : '소형가전' 고유값 유무의 차이가 나는데, 이런 경우에는 어떤 전처리 과정을 거쳐야할까요?
공개 해줄 것으로 생각하고 답변 먼저 작성할게요 👍
라벨 인코더에서 흔히 하는 실수가 train에 fit_transform 한다음 test에도 fit_transform 하는 실수를 범해요!! test에는 transform 으로 진행합니다.
아래쪽에 스케일링에는 정상적으로 한 것으로 보아 실수인 것 같네요!
그 외에는 잘 하고 계십니다 👍