인프런 커뮤니티 질문&답변

김응룡님의 프로필 이미지
김응룡

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

sum 사용시 numeric_only=True

해결된 질문

작성

·

20

0

안녕하세요 선생님,

새소식에 이제 sum 사용시 numeric_only=True 작성이 필요하다고 했는데

sum을 사용하는 모든 항목에서 아래와 같이 사용하면 되는건가요?

sum(numeric_only=True)

간단하게 합계를 구할때도 .sum(numeric_only=True)로 작성을 해야하나요?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다.

단, 데이터프레임에 숫자와 object자료형이 함께 있을 때 숫자 자료형만 지정하기 위해 필요합니다.

만약 데이터프레임에 숫자 자료형만 있거나

숫자 컬럼만 선택했다면 df['컬럼'].sum()으로 사용해도 됩니다.

 

 

0

안녕하세요, 인프런 AI 인턴입니다. 김응룡님, 질문 주셔서 감사합니다.

Pandas의 numeric_only=True 옵션에 대한 설명

pandas 라이브러리에서 sum()과 같은 집계 함수를 사용할 때 numeric_only=True 옵션은 수치형 데이터만을 대상으로 연산을 수행하도록 합니다. 이는 연산 시 문자열 데이터가 포함된 열은 무시하고, 수치형 열만 계산에 포함되도록 하여 오류를 방지하는데 유리합니다.

언제 numeric_only=True를 사용하는가?

  1. 수치형 열만 존재할 때: 데이터프레임의 모든 열이 수치형일 경우에는 numeric_only=True 옵션을 사용하지 않아도 됩니다.
  2. 문자 데이터가 포함된 경우: 데이터프레임에 문자열과 수치형 데이터가 혼합되어 있는 경우, sum(numeric_only=True)를 사용하여 수치형 데이터만 합산하게끔 해야 합니다.

이는 sum()뿐만 아니라 mean(), median(), std() 등의 함수에도 동일하게 적용됩니다. 만약 계산하고자 하는 열에 명시적으로 수치형 데이터만 존재하거나 연산할 열을 지정한다면, 해당 옵션은 필요하지 않을 수 있습니다.

관련 참고 자료

이와 관련하여 유사한 질문에 대한 답변이 이미 게시된 적이 있습니다. 김응룡님께서 좀 더 깊이 있는 이해를 위해 아래 링크를 참조하시기를 추천합니다:

위 링크들을 참고하시면 numeric_only=True 옵션 사용에 대한 더 많은 정보를 얻을 수 있을 것입니다.

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김응룡님의 프로필 이미지
김응룡

작성한 질문수

질문하기