인프런 커뮤니티 질문&답변

kccjjang님의 프로필 이미지
kccjjang

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

데이터 전처리

결측값 채우지관련해서

해결된 질문

작성

·

171

0

안녕하십니까?

 

결측값 채우기 중 최빈값 관련해서,,

m = X_train['workclass'].mode()[0]

여기서 mode()과 mode()[0]의 차이는 무엇인지요?

 

즉 [0]의 쓰임이 무엇인지? 다른 중앙값, 평균 등은 이런게

 

없는데 왜 최빈값만 이런게 뒤에 붙는지요?

 

 

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

  • sum()과 mean(): 값을 반환해요

  • mode()는 시리즈 형태로 반환해요

    • 이유는 사과가 5개, 배가 5개, 딸기가 2개가 있을 때
      최빈값은 사과와 배 2개로 나와요, 값만 반환한다면 모두 표현할 수가 없습니다.
      여러 개를 반환할 수 있게 하기 위해서 시리즈 형태로 반환하고
      만약 한 개라면 인덱스[0]을 붙여서 첫번째 값만 반환 받는 것이에요~

화이팅 입니다 :)

0

안녕하세요, 인프런 AI 인턴입니다.

kccjjang 님의 질문에 대해 답변드리겠습니다. mode() 함수와 mode()[0]의 사용법에 대한 궁금증을 해결하는데 도움이 될 만한 내용을 찾았습니다.

Pandas의 mode() 함수는 데이터에서 가장 빈번하게 나타나는 값을 찾는데 사용됩니다. 이 함수는 최빈값이 하나 이상일 가능성이 있어, 결과로 시리즈(Series)를 반환할 수 있습니다. 만약 여러 개의 최빈값이 있다면, 그 중 첫 번째 값을 선택하기 위해 [0] 인덱스를 사용합니다. 평균값(mean())이나 중앙값(median())과는 달리, 이들은 항상 하나의 숫자만 반환하기 때문에 추가적인 인덱스가 필요하지 않습니다.

kccjjang 님의 경우에 해당되는 유사한 질문으로, 강의 수강생이 mode() 함수 뒤에 [0]을 사용하는 이유에 대해 문의한 내용이 있었습니다. 해당 수강생에게 제공된 답변을 참조하면, 이해에 도움이 될 것입니다:

  • 최빈값 채우기 관련 질문 - 여기서 강사님은 mode() 함수가 반환할 수 있는 여러 결과 중 첫 번째 값을 선택하기 위해 [0]을 사용한다고 설명하고 있습니다.

이 설명이 kccjjang 님의 질문에 대한 답변이 되었으면 합니다. 저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

kccjjang님의 프로필 이미지
kccjjang

작성한 질문수

질문하기