인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

[리뉴얼] 처음하는 파이썬 머신러닝 부트캠프 (쉽게! 실제 캐글 문제 풀며 정리하기) [데이터분석/과학 Part2]

머신러닝 적용을 위한 Feature Engineering 작업1 (업데이트)

머신러닝 적용을 위한 Feature Engineering 작업1

작성

·

76

0

(05:51) Sex 숫자 변환 부분에서 코드를 똑같이 실행했지만 df['Sex']를 출력하면 강의내용과 다르게 NaN값으로 다 변환됩니다.

ㅇㅇㅇㅇ.png.webp

답변 2

0

잔재미코딩 DaveLee님의 프로필 이미지

안녕하세요. 답변 도우미입니다.

동일 수업자료로 금일 테스트해보았을 때, 다음과 같이 정상적으로 출력이 됩니다.

CleanShot 2025-01-26 at 19.09.21.png

혹시 괜찮으시면, 수업자료를 다시 새로 다운받으셔서 한번 해보시는 것도 좋을 것 같고요. 보여주신 부분만으로만 봐서는 동일 코드인 것 같은데, 이전에 데이터가 이미 수정이 되어있어서 다른 데이터를 로드하여 이슈가 있을 수 있을 수도 있을 것 같습니다. 이런 부분은 아마 수업자료를 새로 다른 폴더에 다운받으셔서 그대로 실행해보시면서 기존 코드나 데이터와 어떤 부분이 이슈가 있는지 확인해보시는 것도 도움이 될 것 같습니다.

 

감사합니다.

0

인프런 AI 인턴님의 프로필 이미지

안녕하세요, 인프런 AI 인턴입니다.

0715ksj님께서 문의하신 “Sex” 컬럼이 NaN으로 변환되는 문제에 대해 답변 드리겠습니다.

두 가지 원인과 해결 방법을 소개해 드리겠습니다.

  1. 대소문자 불일치 문제:

    • gender = {"male": 0, "female": 1} 로 대소문자 구분 없이 작성되어 있지만, 데이터프레임의 “Sex” 컬럼에 대문자나 다른 변형이 있을 경우 문제가 생길 수 있습니다. 예를 들어, “Male” 또는 “Female”과 같은 형식이 있다면 map 메소드가 이를 인식하지 못합니다.
    • 해결 방법:
    df['Sex'] = df['Sex'].str.lower().map(gender)
    

    이 코드를 통해 “Sex” 컬럼의 값을 모두 소문자로 변환한 후 매핑을 시도할 수 있습니다.

  2. 매핑 데이터 부족:

    • “Sex” 컬럼에 예상치 못한 다른 값이 포함된 경우에도 NaN이 발생할 수 있습니다.
    • 검증 방법:
    unique_values = df['Sex'].unique()
    print(unique_values)
    

    이 코드를 통해 컬럼에 어떤 값들이 있는지 확인해보세요.

추가적인 예시를 원하시거나 다른 문제가 발생할 경우, 두 개의 검증 방법을 적용해 보시고 문제가 지속된다면 자세한 데이터를 공유해주시면 보다 정확한 솔루션을 제공할 수 있도록 노력하겠습니다.

관련하여 유사한 문제가 논의된 기존 Q&A 게시물은 에러 해결과 프로그래밍 실습에서 확인하실 수 있습니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기