인프런 커뮤니티 질문&답변

sonovan님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제2

섹션3 작업형1 모의고사 풀어보기 1-3 문제 질문드립니다

해결된 질문

24.05.17 18:19 작성

·

151

0

  • 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!

  • 질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요

  • 먼저 유사한 질문이 있었는지 검색해보세요

안녕하세요~

섹션3 작업형1 모의고사 풀어보기 1-3 문제에서 '고유한 값'이 가장 많은 칼럼을 구하라고 했는데,

 

고유한 값이라는게 중복 데이터가 아닌 값들의 갯수를 구하는 건가요?

 

지금 이해가 안가는게 뭐냐면, nuique함수를 쓰면 고유한 값의 갯수가 400 이상 되는데, 실제로 data의 크기는 (5,31)니까 고유한 값은 최대 5개 이상 안되는거 아닌가요??

nuique가 어떤 값을 의미하는지 잘 모르겠습니다..

답변 3

1

sonovan님의 프로필 이미지
sonovan
질문자

2024. 05. 18. 10:44

아 제가 착각했네요; 데이터의 크기가 5,31이 아니라 569,31이었네요 !

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 05. 18. 12:10

네 맞아요. 중복은 제외한 고유값 맞습니다.

nunique() 가 고유값을 세어주고 있어요

 

혹시 추가로 궁금하다면 댓글 부탁드립니다 🙂 화이팅!!

0

인프런 AI 인턴님의 프로필 이미지

2024. 05. 17. 18:21

안녕하세요, 인프런 AI 인턴입니다.

total1997님의 섹션3 작업형1 모의고사 풀어보기 1-3 문제와 관련된 “고유한 값이 가장 많은 칼럼 구하기” 질문에 대해 답변 드립니다.

Pandas의 nunique() 함수는 특정 컬럼(Series) 또는 DataFrame 전체에 대해 고유한 값의 개수를 세어주는 함수입니다. 즉, 중복을 제외한 값들의 개수를 알려줍니다. 고유한 값의 개수가 400 이상이라는 말씀이시라면, 해당 데이터셋의 특정 컬럼이 400이상의 고유한 값을 가진다는 의미일 수 있습니다. 데이터의 크기가 (5,31)이라는 것은 5행 31열이므로, 데이터 전체가 5개의 고유 값만을 가진다는 의미가 아니라, 각각의 컬럼이 최대 5개의 고유한 값을 가진다는 의미입니다. nunique()가 적용되는 범위에서 컬럼 별로 고유한 값의 개수를 세므로, 전체 데이터의 크기와는 별개로 각 컬럼의 고유한 값 개수를 알 수 있습니다.

nunique 함수 사용법에 대해서 궁금하신 점이 있으신 것 같으니, 유사한 맥락의 해답을 참고하실 수 있는 링크를 드립니다. 여기서 비슷한 문제를 다룬 질문과 그에 대한 답변이 포함되어 있습니다:

  • nunique에 관해 문의 드려요. - 이 글에서는 nunique() 함수를 활용하여 데이터셋 내에서 고유한 값의 개수를 파악하는 과정에 대한 질문과 이에 대한 답변이 이루어지고 있습니다. 특정 컬럼의 고유한 값 개수를 구하는 방법에 대한 예시와 설명이 포함되어 있어 유사한 문제에 대한 이해를 돕는데 도움이 될 것입니다.

제가 제공한 링크는 nunique() 함수의 사용법 및 데이터 내 고유한 값의 개수를 구하는 방법에 대한 이해를 돕기 위해 추천드리는 자료입니다. 질문자님이 말씀하신 문제 상황과 정확히 일치하지 않을 수 있지만, 고유한 값의 개수를 파악하는 방법과 관련된 질문에 대한 해법을 이해하는 데 도움이 될 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

sonovan님의 프로필 이미지

작성한 질문수

질문하기