인프런 커뮤니티 질문&답변

soyoung an님의 프로필 이미지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의고사 풀어보기

캐글 T1-12에서 접종률 100% 이상 데이터 먼저 삭제하지 않는 이유

해결된 질문

24.06.08 11:06 작성

·

79

0

아래 문제에서 100% 넘는 접종률을 먼저 삭제하지 않고, 문제에서 언급한 순서대로 풀이해야 하나요??

your code 부분에 적은대로 풀이를 하면 답이 다른데 이대로 풀면 안되는 이유가 궁금합니다!

 

문제 : 주어진 데이터에서 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 그 차이를 구해보세요

  • (단, 100%가 넘는 접종률 제거, 소수 첫째자리까지 출력)

# your code
# 100%가 넘는 접종률 제거
cond = df["ratio"] <= 100

# 상위 10개 국가의 접종률 평균과 하위 10개 국가의 접종률 평균을 구하고, 
df = df[cond]
df = df.sort_values("ratio", ascending = False)
top10 = df["ratio"].head(10).mean()
bottom10 = df["ratio"].tail(10).mean()

# 그 차이를 구해보세요(소수 첫째자리까지 출력)
print(round(top10 - bottom10,1))

 

풀이

df2 = df.groupby('country').max() #시간에 따라 접종률이 점점 올라감
df2 = df2.sort_values(by='ratio', ascending = False)

#100%가 넘는 접종률 제거
cond = df2['ratio'] <= 100
df2 = df2[cond]

top = df2['ratio'].head(10).mean()
bottom = df2['ratio'].tail(10).mean()

print(round(top - bottom,1))

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 08. 11:29

같은 나라 데이터가 계속 등록되었어요

image

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

2024. 06. 08. 11:27

시간에 따라 접종률이 점점 올라가서

최고 값이 국가별 마지막(최종) 값이라고 판단해서 max()가 있습니다.

데이터를 열어보면 한 국가에 여러 데이터가 있어서 아래 풀이는 이전데이터도 포함되어있어요!