인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

안전한 생쥐님의 프로필 이미지
안전한 생쥐

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2회 기출유형(작업형2)

2회 기출유형 작업형 2번 관련

해결된 질문

작성

·

169

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

안녕하십니까

지금 공부 중에

nunique 사용 법에 대한 문의 입니다.

아래와 같이 코딩하면값은

X_train.describe(include = 'O').nunique() 를 사용하면

Warehouse_block 4

Mode_of_Shipment 4

Product_importance 4

Gender 4

dtype: int64

 

로 나오는데요 실제 문제에서 알려주신 코딩으로 하면

X_train[['Warehouse_block', 'Mode_of_Shipment', 'Product_importance', 'Gender']].nunique()

각 5, 3, 3, 2가 나오네요

차이점이 무엇인지 궁금합니다..!

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

X_train.describe(include = 'O').nunique() 이렇게 사용하는 것은 잘못된 사용법입니다.

describe(include='O') 메서드는 객체 타입(문자열 등)의 열에 대한 요약 통계를 반환합니다. 여기서 주의할 점은 describe가 반환한 것은 원본 데이터의 고유값이 아니라, 요약 통계 내의 고유값입니다.

따라서 아래 방법이 정상적인 방법이에요!! 화이팅입니다!!

 

설명 감사합니다..!

안전한 생쥐님의 프로필 이미지
안전한 생쥐

작성한 질문수

질문하기