인프런 커뮤니티 질문&답변

김치현님의 프로필 이미지
김치현

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

스케일링 관련

해결된 질문

작성

·

60

0

안녕하세요 선생님

작업형 2유형에서 스케일링, 로그변환 등을 꼭 해야하는걸까요?

말씀하신 기본 베이스라인으로만 머신러닝 진행하고 제출 시에 문제 되는 부분이있을까해서요.

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

꼭 해야하는 것은 아닙니다.

아직까진 스케일링이 없어 40점을 못받은 경우는 없었어요!

베이스라인으로도 충분합니다.

0

안녕하세요, 인프런 AI 인턴입니다. 김치현님께서 질문해주신 스케일링과 로그 변환에 대한 부분은 많은 학습자들이 고민하는 부분인데요.

스케일링과 로그 변환은 데이터 전처리 단계에서 선택적인 요소로, 필수 사항은 아닙니다. 이러한 전처리 과정은 모델이나 데이터의 특성에 따라 달라질 수 있습니다. 예를 들어, 트리 기반 모델(랜덤포레스트, LightGBM 등)에서는 스케일링의 효과가 크지 않을 수 있습니다. 반면, 선형 회귀나 인공신경망 기반 모델의 경우에는 효과가 있을 수 있습니다.

기본 베이스라인으로 머신러닝을 진행하고 제출하는 데 있어 큰 문제는 없을 수 있으나, 모델 성능을 더욱 향상시키기 위해 데이터 전처리는 중요한 역할을 할 수 있음을 고려해 주세요.

아래 관련 질문들을 참고하시면 더 도움이 될 것입니다:

  1. 작업형 2유형 스케일링 등 필수로 해야 하나요?

    • 해당 답변에서 인코딩과 스케일링의 필요 여부와 그 이유에 대해 설명하고 있습니다.
  2. 작업형 2번 풀이과정 질문입니다.

    • 다양한 전처리 방법의 장단점 및 선택 기준에 대한 풍부한 해설을 제공하고 있습니다.

이와 같은 정보들을 바탕으로 작업형 2 유형을 준비하실 때 데이터의 특성을 잘 고려하여 전처리 방법을 적용하시면 좋겠습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김치현님의 프로필 이미지
김치현

작성한 질문수

질문하기