해결된 질문
작성
·
40
·
수정됨
0
csv 파일을 주어졌으니,
import pandas as pd
df=pd.read_csv
여기까지는 뜻도 모르고 기계적으로 따라하기는 했습니다.
print(df)
한 셀만 이용하라고 하셔서 내용도 궁금하니 확인할 겸 print문을 썼습니다.
. f1 컬럼의 결측치를 중앙값으로 대체
df.isnull().sum()
을 통해 df에 결측치가 있다는 사실을 이해했는데,
df['f1']=df['f1'].fillna()
와 같은 형태로 채우기는 해야하는데.. 중앙값 (median 맞나요??) 코딩을 어떻게 응용해야 할 지 모르겠습니다.
. 나머지 결측치가 있는 데이터(행) 모두 제거
. 앞에서부터 70% 데이터 중 view 컬럼의 3사분위수에서 1사분위수를 뺀 값 계산
궁극적으로 첫번째 문제 때 부터 문제를 읽다가 난독(?) 증상이 와서
어떤 코딩을 어떻게 적용 또는 응용해야 할 지를 몰라서 도무지 갈피가 잡히지 않습니다.
비슷한 고민이나 어려움을 겪어보셨던 분들 조언해주시면 좋겠습니다.
필기합격 유효기간도 얼마 남지 않아서 실기를 꼭 따고싶어서 인터넷 동영상 강의를 들으며 따라해볼 때는 자신감이 붙는 것 같은데, 막상 모의문제 코딩 풀이를 하려니 마음만 앞서고 몸은 전혀 따라주지 않네요...
그냥 처음 몇 번은 고민해봤자 생각이 안되니 코딩 방법이라도 외우든 요령을 틔워야만 할 수 밖에 없는지.. 정말로 갈피가 잡히지 않습니다.
문제 읽고 이해를 못해서.. 문제를 읽고 적합한 코딩을 어떻게 응용해야 할 지 몰라 실기 0점만 주구장창 받으면 스트레스만 쌓이지 않겠습니까?
한 달 전에는 수업 따라가기도 어려웠고, 시험이나 치겠나... 그랬는데....
인강 들으면서 설명해주시는 내용 노트정리를 하고 챗GPT 도움을 구하며 맹연습을 해오기를 한 달 넘게 하고.. 오늘 오후에 커리큘럼에 올라와 있던 8회 기출(240622 실시)을 풀어보니, 단답형은 거의 다 맞혔고, 팟2도 단계나 절차에 따라 코딩을 입력할 수 있었습니다..
팟2 연습할 때는 roc_auc_score 평가지표를 활용한 분류분석 문제만으로 필사를 스무번 가까이 해오다가 오늘 8회 기출을 풀어보니 MAE 평가지표를 활용한 회귀분석 문제여서 중간중간에 코딩 에러도 나오는 등 약간의 시행착오가 있었지만, 한 회분(팟1 세 문제, 팟2 한 문제, 팟3 세트당 세 문제 해서 두 세트.. 도합 열 문제)을 세시간 내 풀 수 있었습니다..
내일 오전 시험을 앞두고 이 정도 감각이라면 나름 자부심(?), 자신감(?)을 가져도 되겠지요? 시험 전 응원 한 말씀 해주시면 힘이 될 것 같습니다. 수업 듣고 따라가기 어렵고 버거워서 스트레스도 많이 받고 (거짓말 조금 보태서..) 짜증도(?) 많이 났었지만.. 내일 유종의 미를 잘 거둘 수 있을 거라는 기대가 됩니다. 그 동안 감사했습니다.