질문 & 답변 - 인프런 | 커뮤니티

질문 게시판

고민있어요

스터디

팀 프로젝트

멘토링

멘토링 후기

수강평

With us

인프런 피드

블로그

인프런 소개

공지사항

대시보드

강의

홈

로드맵

더보기

묻고 답해요

141만명의 커뮤니티!! 함께 토론해봐요.

인프런 TOP Writers

해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

결측치 처리관련 질문입니다.

안녕하세요 결측치 관련 질문드립니다1.시험에서 test 데이터가 주어질시제가 test데이터 행을 삭제하지 않아야 하는것은 인지했습니다.그러나 test 데이터의 결측치를 제 임의대로 값을 넣어도 되는것인가요?강의를 보니 이상치를 컨트롤하는 케이스는 거의없으나결측치는 object는 최빈값 int,float은 중앙값이나 0 을 대입하는데모든경우에 통일되는 방법인가요?혹은 시험장에서 여러가지 결측치 처리 방법을 전부 알고가서 하나하나 검증하며가장 값이 높은걸 넣어야 하나요시험장에서 A로 평가하겠다 하면 검증을 통해 나오는 수치가 A를통해 보통 몇 이상이 나와야 제출할수 있을까요?

김호준 · 6일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

29

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

예시문제 작업형2

안녕하세요. 강의 잘 듣고 있습니다!!예시문제 작업형2에서, 예시에서는 pred가 0,1로만 나오는데제출은 확률값인 0,xxx이런형태로 제출해도 되는 것이 맞나요....?roc_auc_score여서 확률값제출이 맞는 것 같은데, 예제를 볼때는 0/1로만 되어있어 질문드립니다!감사합니다.

cpfk1004 · 6일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

19

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

Key: 'Gender' 오류 해결

drop작업 = 주석 처리 - 진행하지 않으면 key:'Gender' 오류남.영상 19:02부분# baseline - object컬럼 제거 cols = train.select_dtypes(include='object').columns # include는 파라미터라서 ==이 아닌 = 로 대입 cols print(train.shape, test.shape) # train.drop(cols, axis=1, inplace=True) train = train.drop(cols, axis=1) test = test.drop(cols, axis=1) print(train.shape, test.shape) # label from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col] = le.fit_transform(train[col]) test[col] = le.transform(test[col]) train[cols].head() # one-hot

6일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

40

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

머신러닝 질문드립니다.

1. predict와 predict_proba 모두 머신러닝 모델에서 예측할 때 사용하는 함수인데, 빅분기 시험에서 제출할 때 predict_prob함수를 사용해야만 하는 이유가 있나요?2. random_state 경우 train&test split에도 사용하고 예축 모델에서도 사용하셨는데 빅분기 시험에서는 train&test split만 사용해도 괜찮나요? (그리드서치를 통한 하이퍼 파라미터 탐색에서도 train&test split에서만 random_state를 사용하는 경우가 있는 것 같아서요. -> 각 분할된 데이터셋의 최적의 하이퍼 파라미터 탐색하는 방식)

가영 · 6일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

23

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

코랩에서 코딩 자동 입력 해제

이렇게 자동으로 코딩이 되는거 없앨 수 없나요?직접 혼자서 적어보려는데 자동입력이 되어 공부가 잘안되는거같습니다..

7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

28

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

잔차 제곱합 구하는 문제

시험에서 단순선형회귀든 다중선형회귀든잔차 구할 때, model.resid 구하는 함수로 구해도 되나요?(단순선형회귀 강의에서 잔차를 실제값에서 예측값빼는식으로 구하지 않고)

wsyang · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

21

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

영상 9분 33초 질문

--------------------------------------------------------------------------- FileNotFoundError Traceback (most recent call last) Cell In[8], line 1 ----> 1 train_data = pd.read_csv("/kaggle/input/titanic/train.csv") 2 train_data.head() 다운이 제대로 받지 않아서 생기는 문제 같은데요... 영상에서는 다운을 받는 과정이 생략되어있는거 같은데 자세하게 알려주세요

유민곤 · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

22

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

귀무가설 채택/기각

단일표본검정 예시 문제에서 귀무가설을 기각하고 채택하는게 헷갈려 질문합니다! 단측검정 "합격원두 상품의 평균 무게는 120g보다 크다"의 경우 코드를 실행했을 때 p-value가 0.01985가 도출됩니다. 그렇다면 유의수준 0.05보다 작기 때문에 귀무가설을 기각하고 대립가설인 "합격원두 상품의 평균 무게는 120g보다 작다"를 채택하는 것이지요? 그런데 해당 표본의 평균은 120g보다 큰 121g인데.... 어디서 제가 잘못이해한걸까요?

김혁수 · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

33

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

전처리

학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요모의3 같은 경우에는 전처리 스케일링 따로 안하셨는데, 시험장에서도 제가 판단하고 하지 말아야할까요?아니면 라벨링 같은 데이터는 빼고 나머지 숫자 데이터에대해서 전처리하고 해야하는지,, 아니면 라벨링 신경쓰지않고 스켕일링 모두 해도 되는지요?

윰 · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

22

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

2유형 데이터전처리 pop 관련한 질문

train = train.drop('ID', axix=1) test = test.pop('ID')안녕하세요.공부하다가 데이터전처리 과정에서 고민이 생겨서요위코드와 아래코드가 같은걸까요?둘중 아무거나 써도되는지.. 아님 둘중 하나를 추천하시는지.이해가 부족해서 고민하다가 질문올립니다.target=train.pop('타겟컬럼명')

유리시나 · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

37

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

LogisticRegression

왜 이런 오류가 나올까요?

shs4166 · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

23

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제1 에러발생

작업형1 모의문제1 풀고 있는데요tuple indices must be integers or slices, not str 라는 에러가 발생하네요ㅠㅠ 첫번째문제 그대로 따라했는데 데이터 문제일까요?

dlwlgusrkgus · 7일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

20

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

머신러닝 회귀 모델 반복 실행할수록 값 바뀜 현상

# RandomForestRegressor from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() model.fit(X_tr, y_tr) pred = model.predict(X_val) rmse(y_val, pred)머신러닝 회귀 모델에서스케일링 해둔걸 주석처리하고 이전 셀 실행 후 위 코드를 실행해서 베이스라인 값을 체크하려는데,강의와 다른 값이 나와서 한번 더 실행했더니 값이 또 바뀌는데 원인이 뭘까요?이후에도 계속 실행할수록 값이 매번 바뀝니다!

오벽 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

28

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

alternative 문의

여러 검정들마다 alternative를 어떤것은 붙이고, 어떤것은 안붙이는 것이 헷갈립니다. 기억을 쉽게 하는 방법이 있을까요

wsyang · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

26

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형1 모의문제1의 3번 문제 질문

df['f3'] = df['f3'].replace(np.nan, '0').replace('silver', '1').replace('gold', '2').replace('vip', '3') print(df['f3'].sum()) 이렇게 코드 작성 시, 202003010232022222222222221220231112102221022220222223101200121202012002200221032202021220121202라고 값이 뜨는데, 정수로 바꾼 다음에 합을 구할 때는 어떻게 하나요?

xpskzk · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

28

답변

2
미해결
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

링크오류

적어주신 링크 적어서 들어가면 오류가 뜨는데 왜이러는걸까요ㅠㅠ

qkrtpfls23 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

23

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

강의에 섹션 21. 구버전 영상 (삭제 예정) 이 있는데

이것은 수강 안해도 되는건지요?

이인경 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

31

답변

2
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

target변수 생성시 오류

데이터 전처리 전 타켓변수를 만들때 마다 오류메세지가 뜹니다.그리고 train의 'id' 를 삭제할 때에도 비슷한 오류가 뜨는데 도와주세요

모레 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

30

답변

3
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

작업형 2유형 질문있습니다!

안녕하세요 선생님 작업형 2유형 관련해서 질문이 있습니다. 2유형에서 고득점을 목표로 하지 않기 때문에 간단하게 기본 공식만 외워가려고 생각중인데요 target = train.pop("A")train = pd.get_dummies(train)test = pd.get_dummies(test) from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split(train,target,test_size = 0.2, random_state = 0) from sklearn.ensemble import RandomForestRegressorrf = RandomForestRegressor(random_state=0)rf.fit(X_tr,y_tr)pred = rf.predict(X_yal) pred = rf.predict(test)result = pd.DataFrame({'pred':pred})result.to_csv("result.csv",index=False)print(pd.read_csv("result.csv").head())print(pd.read_csv("result.csv").shape) 이런식으로 간단하게 문제에 맞춰 작성했을때 빨간색 하이라이트 부분을 제출을 하는건데 , 초록색 부분을 주석처리를 해줘야 하는걸까요? 아니면 주석처리 하지 않고 위에처럼 제출을 하면 될까요?추가적으로 주석처리가 필요한 부분이 있으면 알려주십쇼!!

김응룡 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

34

답변

1
해결됨
[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(분류) 질문! 왜 수치형 데이터만 활용하는가?

모델링 및 평가(분류) 강의에서 X_train 데이터의 15개의 칼럼 데이터 중 일부 수치 데이터만 활용하여 머신러닝에 사용하는데, 모든 데이터를 다 활용하지 않는 이유가 있을까요?만약 모든 데이터를 다 활용한다면 roc_auc_score의 변화는 어떻게 되나요?

오벽 · 8일 전 · [퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

투표점수

0

조회수

22

답변

2

인기 태그

주간 인기글