인프런 커뮤니티 질문&답변

뚜디니님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

6회 기출유형 (작업형2) 🆕 updated 2023.9

작업형 2 - 데이터 전처리에서 공식같은 게 있을까요??

해결된 질문

24.06.12 02:54 작성

·

136

0

작업형 2 - 데이터 전처리에서 공식같은 게 있을까요??

 

이 의미는

 

데이터 타입이 object, int/float 섞여있을 때

 

수치형만 모아서 분석을 한다거나

수치형+범주형 같이 모아서 분석을 한다거나

 

위 두 개의 경우 점수 배점 차이가 없을지 궁금합니다.

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 12. 10:50

분석을 한다는 것이 모델 학습을 한다는 의미일까요?

수치형과 범주형 둘 다 사용해서 모델을 학습시켜주세요!

시험에서의 데이터가 어떤지 알 수 없고 점수를 공개하지 않아 배점 차이는 누구도 답변할 수 없는 부분이에요!ㅠ

극단적으론 수치형 변수가 없을 수도 있는데 수치형만 모델학습한다는 것은 말이 안되거든요~

 

하지만 그동안 기출을 살펴봤을 때
범주형(인코딩 처리)과 수치형 둘다 제출한다면 큰 문제없이 40점을 받을 수 있었어요!

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 12. 02:56

안녕하세요, 인프런 AI 인턴입니다. 뚜디니님의 질문에 대해 유사한 질문들을 참고하여 답변을 준비했습니다.

작업형 2에서 데이터 전처리와 관련하여, 전처리 과정에 대한 공식적인 방법은 없습니다. 다만, 데이터의 특성과 필요에 따라 수치형 데이터와 범주형 데이터를 분리하여 처리할 수 있습니다. 범주형 데이터는 일반적으로 라벨 인코딩(label encoding)이나 원-핫 인코딩(one-hot encoding)을 통해 숫자형 데이터로 변환합니다. 수치형 데이터는 스케일링(scaling)이나 정규화(normalization)를 통해 데이터의 범위를 조정할 수 있습니다.

관련 정보:

  1. 작업형2 풀이 시에 데이터 전처리

    • 이 글에서는 작업형 2 문항을 풀이할 때 필수 데이터 전처리에 대해 설명합니다. 범주형 컬럼 인코딩과 결측치 처리가 필수적이라고 언급합니다. 숫자 데이터만 있다면 바로 데이터 분리와 학습으로 넘어가도 좋다고 조언합니다.
  2. 데이터 전처리시 궁금점!

    • 여기서는 데이터 전처리 시 범주형 데이터와 수치형 데이터에 따라 다른 전처리 방법을 사용하는 것이 맞는지에 대한 설명을 합니다. 이는 작업형 2에서도 동일하게 적용될 수 있습니다.

각 링크는 데이터 전처리의 일반적인 접근 방식과 별도로 작업형 2에서의 특별한 상황을 고려한 전략을 제공합니다. 여러분이 언급하신 수치형 데이터만 사용하는 경우나 수치형 데이터와 범주형 데이터를 함께 사용하는 경우에 대한 점수 배점의 차이에 대한 직접적인 언급은 없지만, 이러한 처리 방법을 적절히 적용하면 데이터 분석의 성능을 높일 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.