인프런 커뮤니티 질문&답변

since4042님의 프로필 이미지
since4042

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

4회 기출유형(작업형1)

기출유형 4회(작업형1)

해결된 질문

작성

·

106

0

(문제)

date_added가 2018년 1월 이면서 country가 United Kingdom 단독 제작인 데이터의 갯수

(풀이4)

# 풀이4
import pandas as pd
df = pd.read_csv("nf.csv")

cond1 = df['country'] == "United Kingdom"

df['date_added'] = df['date_added'].fillna("")

str1 = "2018"
str2 = "January"
cond2 = df['date_added'].str.contains(str1)
cond3 = df['date_added'].str.contains(str2)

print(len(df[cond1 & cond2 & cond3]))

이 풀이에서

df['date_added'] = df['date_added'].fillna("")

중간에 fillna를 사용한 이유는 무었인가요?

빼고 해도 답은 같아서요.

다른 필요한 상황이 있을까요?

 

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

결측치가 있는 경우 str.contains 사용 시 에러가 날수 있습니다.

결측치(NaN)를 문자로 따졌을 때 아무것도 없는 값 "" 으로 채웠어요!

since4042님의 프로필 이미지
since4042

작성한 질문수

질문하기