인프런 커뮤니티 질문&답변

ji_nhee님의 프로필 이미지
ji_nhee

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출유형(작업형1)

4회 기출유형 작업형1 2번문제

해결된 질문

작성

·

377

0

안녕하세요~ 데이터의 개수를 구할때 len과 sum의 차이가 궁금합니다 ㅠㅠ

예를들어 4회 기출유형 작업형1의 2번문제와 같은경우

문제 : (loves반응+wows반응)/(reactions반응) 비율이 0.4보다 크고 0.5보다 작으면서, type 컬럼이 'video'인 데이터의 갯수

이고,

최종 데이터 개수를 구할때 len 함수를 사용했습니다.

코드 :

cond1 =(df['loves'] + df['wows'])/df['reactions'] > 0.4

cond2 =(df['loves'] + df['wows'])/df['reactions'] < 0.5

cond3 = df['type'] =="video"

len(df[cond1 & cond2 & cond3])

sum으로는 왜 안되는걸까요? ㅠㅠ 예시는 없지만 작업형1 유형에서 다른 문제는 데이터 개수를 구할때 sum을 사용한적도 있던것 같아서 문의드립니다.

 

 

답변 1

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

네 맞습니다. len을 활용할 때도 있고, sum을 활용할 때도 있어요

len(데이터프레임), sum(조건의 결과 True, False) True는 1, False는 0이에요

위 예시에서는 최종 데이터프레임 형태임으로 len을 사용했어요

sum일 때는

cond = df['reactions'] < 0.5

sum(cond)로 사용가능합니다.

ji_nhee님의 프로필 이미지
ji_nhee

작성한 질문수

질문하기