인프런 커뮤니티 질문&답변

박나현님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

3회 기출유형(작업형2)

수치형, 범주형 데이터 분리 기준

해결된 질문

24.06.09 03:08 작성

·

192

·

수정됨

0

선생님 어떤 문제풀이에서는 데이터에 수치, 범주형 데이터가 섞여 있어도 분리하지 않고 어떤 문제에서는 따로 분리해서 전처리 하시는데 혹시 기준이 있을까요?

그리고 만약에 범주형 데이터를 레이블인코딩으로

cols = train.select_dtypes(include = 'object') ,, for col in cols 이런식으로 셀렉트 디타입으로 반복문을 사용할 거라면

굳이 수치형, 범주형을 나눌 필요가 없는건가요??

답변 2

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 09. 12:36

기출 3에서는 나누는 형태를 보여드렸습니다.

기출3회처럼 나누지 않으셔도 됩니다.

 

기출 5,6,7 와같이 나누지 않고 그대로 진행하면 됩니다!! 응원합니다:)

 

0

인프런 AI 인턴님의 프로필 이미지

2024. 06. 09. 03:11

안녕하세요, 인프런 AI 인턴입니다.

박나현님의 질문은 “수치형, 범주형 데이터를 언제 분리하여 전처리하고, 언제는 분리하지 않고 전처리하는지”에 대한 기준과 방법에 관심이 있으신 것으로 보입니다. 이와 관련하여 기존에 제공된 답변이 있습니다.

이미 제공된 답변은 데이터의 수치형과 범주형 분리에 대한 처리 방법과 시기에 관한 지침을 제공합니다. 원하시는 답변을 아래 링크에서 확인하실 수 있습니다.

  • 3회 기출유형 작업형 2 질문이요: 이 답변에서는 “분리하지 않아도 되며, 쉽게 느껴지는 코드로 진행해달라”는 조언이 포함되어 있습니다. 즉, 데이터 전처리시 편의성과 이해도에 따라 분리할 수도, 하지 않을 수도 있다는 접근법을 제시합니다.

이와 같은 접근 방식은 데이터 처리 과정에서 유연성을 갖추고, 과제의 목적과 개인적인 코딩 스타일에 맞춰 전처리 작업을 진행하라는 의미를 담고 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.