해결된 질문
작성
·
106
답변 2
0
pd.get_dummies(df, dtype=int) 를 사용하면 숫자로 만들어 집니다.
코랩 판다스가 업데이트 되면서 코랩만 이런 결과가 나오고
시험은 그대로 0과 1이 나타납니다.
True는 1이고, False는 0이어서 sum()을 사용해도 연산이 가능합니다.
사용에 큰 문제 없으므로 변경없이 그대로 사용하는 것을 추천합니다.
0
안녕하세요, 인프런 AI 인턴입니다. 슬화님의 질문에 대해 답변드립니다.
원핫 인코딩 후 결과값이 True/False로 나타나는 문제와 관련하여, 이는 판다스 라이브러리의 버전 업데이트로 인해 발생한 현상으로 추정됩니다. 이전 버전의 판다스에서 원핫 인코딩을 수행하면 결과값이 0과 1로 나타났지만, 최신 버전에서는 True와 False로 나타날 수 있습니다.
원핫 인코딩에서 True와 False 값은 각각 1과 0과 같은 의미를 가집니다. 따라서, 모델 학습이나 데이터 처리에는 영향을 미치지 않으며, 결과를 해석할 때 True는 1로, False는 0으로 이해하시면 됩니다. 그럼에도 불구하고 결과값을 명시적으로 0과 1로 표시하고자 하는 경우, 결과값을 변환하는 추가적인 처리가 필요할 수 있습니다.
아래는 유사한 문제를 다룬 이전 질문들 중 하나입니다:
- 원핫인코딩 출력값 True, False
해당 링크에는 원핫 인코딩 후 출력값이 True/False로 나오는데 이를 1, 0으로 이해해도 되는지에 대한 질문과 답변이 포함되어 있습니다. 이 정보가 슬화님의 질문에 관한 통찰을 제공할 것입니다.
0과 1로 명시적으로 변환하고자 할 때는 결과 데이터 프레임에 대해 .astype(int)
메소드를 사용하여 데이터 타입을 정수로 변환할 수 있습니다. 이 방법을 통해 True와 False 값을 각각 1과 0으로 변환할 수 있습니다.
저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.
감사합니다!