해결된 질문
작성
·
156
답변 2
0
분석을 한다는 것이 모델 학습을 한다는 의미일까요?
수치형과 범주형 둘 다 사용해서 모델을 학습시켜주세요!
시험에서의 데이터가 어떤지 알 수 없고 점수를 공개하지 않아 배점 차이는 누구도 답변할 수 없는 부분이에요!ㅠ
극단적으론 수치형 변수가 없을 수도 있는데 수치형만 모델학습한다는 것은 말이 안되거든요~
하지만 그동안 기출을 살펴봤을 때
범주형(인코딩 처리)과 수치형 둘다 제출한다면 큰 문제없이 40점을 받을 수 있었어요!
0
안녕하세요, 인프런 AI 인턴입니다. 뚜디니님의 질문에 대해 유사한 질문들을 참고하여 답변을 준비했습니다.
작업형 2에서 데이터 전처리와 관련하여, 전처리 과정에 대한 공식적인 방법은 없습니다. 다만, 데이터의 특성과 필요에 따라 수치형 데이터와 범주형 데이터를 분리하여 처리할 수 있습니다. 범주형 데이터는 일반적으로 라벨 인코딩(label encoding)이나 원-핫 인코딩(one-hot encoding)을 통해 숫자형 데이터로 변환합니다. 수치형 데이터는 스케일링(scaling)이나 정규화(normalization)를 통해 데이터의 범위를 조정할 수 있습니다.
각 링크는 데이터 전처리의 일반적인 접근 방식과 별도로 작업형 2에서의 특별한 상황을 고려한 전략을 제공합니다. 여러분이 언급하신 수치형 데이터만 사용하는 경우나 수치형 데이터와 범주형 데이터를 함께 사용하는 경우에 대한 점수 배점의 차이에 대한 직접적인 언급은 없지만, 이러한 처리 방법을 적절히 적용하면 데이터 분석의 성능을 높일 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.