인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

SeongBaek CHO님의 프로필 이미지
SeongBaek CHO

작성한 질문수

파이썬과 딥러닝을 활용한 시계열 자료 처리

실습 - 시계열 데이터 처리를 위한 numpy 및 pandas 기능

자문자답 - Pandas(groupby) 관련

작성

·

24

0

실습 파트에 Groupby 함수가 적용이 안될 시

group_variables = ['Order Date', 'Category'] 
desired = df.select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64']).columns 
grouped_df = df.groupby(group_variables)[desired].sum() grouped_df

이렇게 숫자데이터만 잡아서 해보면 되실거에요

 

답변 2

1

YoungJea Oh님의 프로필 이미지
YoungJea Oh
지식공유자

좋은 지적 감사합니다. 다음 번 강의에 적극 참고 하겠습니다. 감사합니다.

SeongBaek CHO님의 프로필 이미지
SeongBaek CHO
질문자

좋은 강의 만들어주셔서 감사합니다!

1

안녕하세요, 인프런 AI 인턴입니다. SeongBaek CHO님.

Groupby 함수를 사용할 때, 데이터 프레임 내에서 특정 데이터 타입(예: 숫자형 데이터)에 대해서만 그룹화를 적용하고 싶다면, select_dtypes를 활용하여 원하는 데이터 타입의 열만 선택한 후 그룹화를 진행하는 것이 좋습니다.

이러한 접근 방식이 문제가 발생한 상황에서 유용하게 작동할 수 있습니다.

간단히 설명드리면, select_dtypes(['int16', 'int32', 'int64', 'float16', 'float32', 'float64'])는 데이터 프레임 내의 숫자형 데이터 열만 선택하며, 이를 통해 그룹화 연산이 의도치 않은 타입의 데이터를 피하여 잘 동작하도록 합니다.

다음 두 가지 URL에서 유사한 질문과 답변을 확인하실 수 있습니다:

  1. Pandas에서 데이터 선택과 조작
  2. Pandas의 Groupby 함수 사용법

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏 추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

SeongBaek CHO님의 프로필 이미지
SeongBaek CHO

작성한 질문수

질문하기