해결된 질문
작성
·
76
0
import pandas as pd
df = pd.read_csv('../input/titanic/train.csv')
pd.set_option('display.max_columns',None)
# print(df.head(3))
q1 = df['Fare'].quantile(0.25)
q3 = df['Fare'].quantile(0.75)
iqr = q3 - q1
cond1 = df['Fare'] < q1 - 1.5 * iqr
cond2 = df['Fare'] > q1 + 1.5 * iqr
df = df[cond1 | cond2]
cond3 = df['Sex'] == "female"
print(len(df[cond3]))
제 코드입니다.
저는 cond1 이거나 cond2 이렇게 조건을 주면 그게 모두 이상치이고
그 이상치를 df에다가 다시 덮어씌운다음에 여자인 조건 cond3을 준다음에 len을 사용해서 했는데 답이 너무 다르게 나와서 제 풀이는 왜 답이 안되는걸까요?
이해를 못하겠습니다 ㅜㅜㅜ