섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제... - 인프런

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2(구 버전): 학습시간 최소화를 위해 구 버전은 삭제하고 있어요!

섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2

해결된 질문

작성

224

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요
먼저 유사한 질문이 있었는지 검색해보세요

안녕하세요.

아래 링크에 문제 풀이 작성 해봤습니다.

피드백 주시면 감사하겠습니다!

섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2

https://colab.research.google.com/drive/1M2_HMpVPDFk8IheSEDd34Z5sgxheVCI1#scrollTo=eFsvM0T51nzg

python 머신러닝 빅데이터 pandas 빅데이터분석기사

답변 1

퇴근후딴짓

지식공유자

규다님, 안녕하세요! 열공하고 계시네요!🔥

부탁 하나 드릴게요:) 해당 과정의 질의응답은 '1:1 멘토링'이 아닌 '공개'형태입니다.

따라서 수강하는 다른 분들도 함께 보고 학습할 수 있도록 질문코드를 공유해줄 때는 제게만 공개하는 방식 말고 모두에게 공개 부탁드립니다. 또는 본문 내용에 담아주셔도 좋습니다. 🙏
그리고 질문이 구체적이면 자세한 답변이 가능할 것 같아요

저도 좋은 답변을 달고자 함이오니 부탁드리겠습니다 👍

퇴근후딴짓

지식공유자

공개 해줄 것으로 생각하고 답변 먼저 작성할게요 👍

라벨 인코더에서 흔히 하는 실수가 train에 fit_transform 한다음 test에도 fit_transform 하는 실수를 범해요!! test에는 transform 으로 진행합니다.
아래쪽에 스케일링에는 정상적으로 한 것으로 보아 실수인 것 같네요!

그 외에는 잘 하고 계십니다 👍

규다

질문자

안녕하세요!

공개로 전환 했습니다. (방법을 모르고 있다가 이번에 알게 되었네요 : ▷ )
1) corr() 함수를 통해 주관적으로 유사성이 있다고 판단되는 '총구매액', '최대구매액', '환불금액' 피쳐 중에서 강한 상관관계를 나타내는 최대구매액을 제외한 나머지 피쳐는 아예 삭제처리하고 모델링을 진행했는데요. 이렇게 진행해도 되는건지 확신이 안섭니다.
2) x_train과 x_test 데이터에서 '주구매상품' : '소형가전' 고유값 유무의 차이가 나는데, 이런 경우에는 어떤 전처리 과정을 거쳐야할까요?

인프런 커뮤니티 질문&답변

섹션 4 - 기출문제 유형파악2021 - 스페셜 게임 - 예시문제 작업형2