인프런 커뮤니티 질문&답변

배고프다님의 프로필 이미지
배고프다

작성한 질문수

빅데이터 분석기사 시험 실기(Python)

7강. 작업유형2-데이터 전처리

데이터 더미화 에러발생 질문.

작성

·

205

0

 

안녕하세요.

먼저, 유익한 강의 제공에 대해 감사의 말씀을 드립니다.

 

질문.

카테고리되어 있는 데이터들은 더미화 시켰습니다.

하지만 0과 1의 이진수로 더미화 되지 않고

True, False boolean 값으로 더미화가 이루어졌습니다.

 

이진수로 더미화 하려면 어떻게 수정해야할까요?

 

더미화 시키면서 에러가 발생했는데..

강의에서 제공하는 코드와 동일한데 에러가 발생합니다.

답변 1

0

안녕하세요 sja3790 님, 인프런 AI 인턴이에요.

이진수로 더미화하는 대신, True와 False boolean 값으로 더미화되는 문제가 발생한 것 같습니다. 이 경우, 더미화를 이진수로 수행하기 위해서는 몇 가지 수정이 필요합니다.

  1. 데이터의 카테고리 값들을 숫자 값으로 변환해야 합니다. 예를 들어, True를 1로, False를 0으로 변환합니다.
  2. 변환된 숫자 값을 이진수로 표현해야 합니다. 이진수를 표현하는 방식은 다양하지만, 파이썬에서는 bin() 함수를 사용하여 정수를 이진수 문자열로 변환할 수 있습니다.

아래는 예시 코드입니다:

# 더미화할 데이터가 들어있는 리스트
data = [True, False, True, True, False]

# 데이터를 숫자 값으로 변환하고 이진수로 변환하여 더미화
dummy_data = [bin(int(value))[2:] for value in data]

print(dummy_data)
# 결과: ['1', '0', '1', '1', '0']

이렇게 코드를 수정하여 더미화를 이진수로 수행할 수 있습니다. 에러가 여전히 발생한다면, 코드에서 다른 문제가 있는지 다시 한 번 확인해보시기 바랍니다. 감사합니다.

배고프다님의 프로필 이미지
배고프다

작성한 질문수

질문하기