해결된 질문
작성
·
377
0
안녕하세요~ 데이터의 개수를 구할때 len과 sum의 차이가 궁금합니다 ㅠㅠ
예를들어 4회 기출유형 작업형1의 2번문제와 같은경우
문제 : (loves반응+wows반응)/(reactions반응) 비율이 0.4보다 크고 0.5보다 작으면서, type 컬럼이 'video'인 데이터의 갯수
이고,
최종 데이터 개수를 구할때 len 함수를 사용했습니다.
코드 :
cond1 =(df['loves'] + df['wows'])/df['reactions'] > 0.4
cond2 =(df['loves'] + df['wows'])/df['reactions'] < 0.5
cond3 = df['type'] =="video"
len(df[cond1 & cond2 & cond3])
sum으로는 왜 안되는걸까요? ㅠㅠ 예시는 없지만 작업형1 유형에서 다른 문제는 데이터 개수를 구할때 sum을 사용한적도 있던것 같아서 문의드립니다.
답변 1
0
네 맞습니다. len을 활용할 때도 있고, sum을 활용할 때도 있어요
len(데이터프레임), sum(조건의 결과 True, False) True는 1, False는 0이에요
위 예시에서는 최종 데이터프레임 형태임으로 len을 사용했어요
sum일 때는
cond = df['reactions'] < 0.5
sum(cond)로 사용가능합니다.