해결된 질문
작성
·
84
·
수정됨
0
[문제]
주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요 . (단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)
import pandas as pd
df = pd.read_csv('../input/covid-vaccination-vs-death/covid-vaccination-vs-death_ratio.csv')
#시간에 따라 접종률이 점점 올라감
df2 = df.groupby('country').max()
df2 = df2.sort_values(by='ratio', ascending = False)
#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]
top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()
print(round(top - bottom,1))
문제와 정답코드는 위와 같이 적어주셨는데, 여기서
#시간에 따라 접종률이 점점 올라감
df2 = df.groupby('country').max()
이 말의 뜻과, 코드가 이해가 되지 않습니다.
답변 1
0
데이터를 열어보면
데이터가 누적으로(중복) 쌓이고 있어요
그러니깐
나라, 접종률, 날짜
한국 78% 어제
한국 79% 오늘
한국 80% 내일
날짜로 최신을 찾아도 되지만 가장 큰 값이 최신값이라 판단했어요!