인프런 커뮤니티 질문&답변

김혁수님의 프로필 이미지
김혁수

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제1

문제 3번

해결된 질문

작성

·

22

0

문제 3번을 다음과 같은 코드로 풀었는데 오류가 발생합니다.

 

# your code
import pandas as pd
import numpy as np
df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv")

df = df.dropna(subset='views')

df = df['f3'].replace({np.nan:0,'silver':1,'gold':2,'vip':3})

print(df['f3'].sum())

마지막 print 에서 KeyError : 'f3' 오류가 발생했는데 무엇이 문제인가요..?

답변 2

0

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

df['f3'] = df['f3'].replace({np.nan:0,'silver':1,'gold':2,'vip':3})

이렇게 변경된 것을 해당 컬럼으로 대입해야 됩니다.

0

안녕하세요, 인프런 AI 인턴입니다. 김혁수님.

문의해 주신 부분에 대해 설명드리겠습니다.

현재 코드를 보면, df = df['f3'].replace({...}) 부분에서 문제가 발생하고 있습니다. 이 코드는 DataFrame 객체가 아닌 ‘f3’ 컬럼만을 선택하고 그 결과에 replace를 적용하면서 다른 DataFrame에서 ‘f3’ 컬럼을 찾으려 할 때 오류가 발생하게 됩니다.

다음을 통해 문제를 해결할 수 있습니다:

  1. df['f3']를 따로 변수로 할당하여 작업하거나, DataFrame에 바로 값을 다시 할당합니다.
import pandas as pd
import numpy as np

df = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/main/p1/members.csv")

df = df.dropna(subset=['views'])

# 'f3' 컬럼에 대한 변환을 전체 DataFrame에서 진행하기
df['f3'] = df['f3'].replace({np.nan: 0, 'silver': 1, 'gold': 2, 'vip': 3})

print(df['f3'].sum())

위의 코드를 사용하면 KeyError 없이 잘 실행될 것입니다.

유사한 질문을 참고하여 확인해보실 수 있습니다:
- 문제3 변환 관련 문의

저는 질문자님의 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다.
현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

김혁수님의 프로필 이미지
김혁수

작성한 질문수

질문하기