묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 답안제출 시
선생님, 이번 실기문제 중 작업형2에 평가지표가 mae로 나왔는데 에러 값이면 최소값을 해야하는데 모델 3가지를 실행 후 최대값으로 제출해버렸는데, 다른 사항들은 다 조건에 맞춰도 아예 0점 처리되나요??...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2유형 관련 문의드립니다.
안녕하세요 선생님.작업형 2유형 답안 제출 관련 문의 드립니다.작업형 2유형 문제를 해결하면서 선생님이 알려주신 단계대로 차근차근 진행하여 csv예측 파일까지 잘 작성했습니다.마지막에 작성된 csv파일을 확인하는 Print(pd.read_csv("result.csv))구문만 빼고 전 단계의 print구문은 다 주석처리 하고 마지막에 최종 1회만 제출했습니다.앞 단계의 print구문들은 주석처리 하여도 제가 작성하였던 코드만 실행된 상태로 제출되면 감독관이 체점하는대는 아무 문제 없는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 분석가? 공부방향 문의
안녕하세요. 강사님 수업듣고 큰 도움을 받은 수강생입니다. 먼저 감사하다는 말씀드리고 싶네요.비전공자로 막연한 관심에 파이썬이 뭔지 궁금해하다가 빅데이터 분석기사 시험이 파이썬으로 할수있다는 정보를 알게되고, 시험응시를 하면서 공부해볼 수 있겠구나 싶어서 시작해봤습니다.막상 꾸준히 공불못해서 필기도 실기도 벼락치기하면서 시험을 치뤘지만, 앞으로 데이터분석가 수준으로 조금 더 딥하게 공부해보고 싶은 마음이 생겼습니다.강의에서 캐글, 데이터분석 대회, 스터디 참여 등을 추천해주셔서 해보려고 합니다. 대신 조금만 더 구체적으로 파이썬을 활용하거나 꼭 그렇지않더라도 딥러닝 영역까지 학습하고 숙련할 수 있는 방법론에 대한 의견을 여쭙고 싶습니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
lightgbm 예측값 오류?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이번 시험에서 작업형2 문제 풀이 과정입니다 Test 데이터에 총 3개의 범주형 컬럼이 존재 하였습니다. 월, 요일, 네임 이때 각 고유값은 12,7,2 여서 따라서 월과 요일은 라벨인코딩 / 네임은 겟더미즈 로 각각 하였습니다. 이후 모델 성능을 비교파기 위해 랜덤포레스트와 라이트지비엠을 사용 하였습니다. 랜포리그레서로 학습시키고 예측할 땐 random_state 만 고정한채 mae로 평가하였더니 140 정도였고 XGBM리그레서로 학습시키고 mae로 평가하니 108 정도 나왔습니다. 이때도 딱히 하이퍼 파마미터튜닝은 진행하지 않았습니다. 따라서 test 데이터를 xgbmregressor에 적용하여 예측한 결과를 제출하였습니다. 다만 여기서 lightgbm 을 사용하신 분들이 랜덤포레스트에서는 없었던 음수값이 예측에 나왔다고 하는데, 전처리를 동일하게 하고 평가도 좋게나온 모델의 결과가 저렇게 오류로 나올 수가 있나요..?그냥 남들 다 쓰는 랜포 쓸걸 괜히 lightgbm 알아서 쓴거 같다는 기분이 듭니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번 빅분기 실기 8회 (오즈비 관련)
이번 시험에서 오즈비가 또 나왔습니다. 지난 시험에서는 특정 변수값이 1 증가할때의 오즈비를 구하라고 나와서 다음과 같이 구했었습니다. import numpy as npnp.exp(계수) --> 답 이번 문제에서는 특정 변수값이 5 증가할때의 오즈비를 구하라고 나왔습니다.그러면 답이 아래와 같나요? np.exp(5*계수)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅데이터분석기사 실기 작업형 2
안녕하세요.8회 빅데이터분석기사 실기 작업형 2에서 다른 모델들보다 xgboost 패키지에 XGBRegressor가 성능이 훨씬 좋길래 그 모델을 사용해서 제출했습니다.Future Warning이 나왔지만 별 생각하지 못하고 제출했는데, 시험장 나오고 나서 생각해보니 너무 욕심이었나 생각이 듭니다.결과 파일을 제출한 후, 다시 파일을 확인했을 때, 이상은 없었습니다만 Warning이 나오면서 코드를 다시 확인하라는 메세지가 있어서 혹시 몰라 질문드립니다.아시는 분은 꼭 답변 부탁드릴게요.감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅분기 실기 2유형 시험간 헷갈리는 부분
MinMaxScaler + one-hot encoding lightgmb(n_estimator = 300) +mae 사용하여 예측하였는데 (mae : 93~94) 예측값이(인원수) 2096개(?)중에서 음수가 11개 나오더라고요.이렇게 예측값이 양수가 나와야하는 경우 보통 음수에 대해 후처리를 한번 더 해서 내보내는건지, 아니면 상관이 없는건지 궁금합니다...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 시험 작업형2
선생님 제가 풀었을때는 pred값이 소수 셋째자리까지 나오는데 시험 제출예시에서는 깔끔하게 정수로 되어있길래 마지막에 pred.astype(int)로 바꿔서 제출했는데 혹시 문제될까요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 답 복기
작업형1313 / 239 / -0.026 작업형2lightgbm 하이퍼파라미터튜닝으로mae 92정도 작업형3-(1)12 / -0.456 / 7.919 작업형3-(2)2.129 / 0.313 / 104.873 랜포보다 lgb가 성능이 더 좋길래 썼는데 나중에 pre 데이터 min값 찍어보니 음수 나오더라구요 ㅠ 이러면 감점 혹은 0점 처리될까요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험후기
기억나는 문제 쭉 적어 봅니다. 유형1 3번민맥스 정규화 라고 나와서 당황 했는데그냥 민맥스 스케일로 풀었습니다 ㅎㅎ 유형2mae로 평가하는 회귀문제원핫인코딩만 하고 랜덤포레스트 돌렸을때mae값 93? 95? 쯤 나와서 그냥 제출했습니다. 유형3-1로지스틱 회귀문제유의하지 않은 변수가 몇개인지 쓰는문제2.1에서 나온결과 유의한 변수로 로지스틱 모델 다시 만든 회귀계수 값 평균 만들기시험푸는 중간에 알림으로 ???가 유의하면 포함해서 계산? 하라는내용이 왔습니다.그래서 절편? 도 포함해서 계산했는데 맞는지 모르겠네요.. 새로운 값을 넣어서 값을 예측하는 문제3-2.특정변수 가 5 변할때 오즈값이 얼마나 변하는지?오즈비 구해서 *5 해버렸습니다.. 맞을지 모르겠네요합격했으면 좋겠습니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 , 3유형 코드제출 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요좋은 강의 덕분에 오늘 시험을 잘마쳤습니다!다만 시험을 끝내고 결과확인을해보니답안은 모두 제출하였습니다만…작업형 1/3유형 풀이 (코드) 부분이 미제출로 나와서 이부분이 문제가 되지 않을까 걱정되어 문의 드립니다. 혹시 코드가 제출더ㅣ지 않으면 문제가 될까요?
-
미해결빅데이터분석기사 실기대비 (R 활용)
이번시험 작업형2 질문
이번시험작업형2유형 rpart랑 glm만 써서 똑같이 더하고 2로 나눠서 제출했는데 몇점정도 나올까요??작업형 2유형 30점밑이면 불합이라서요mae값은 대충 400~500때에여
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 - 작업형2
fit 전까지는 잘 실행되었는데 저기서부터 막히네요 ㅠㅠ unknown label type: continuous는 뭘까요,,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
작업형2에서 rmse 반복문을 못쓸거 같은데 그냥 sklearn에서 mse 불러와서 **0.5만 써서 프린트해도 될까요,,, ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 2회 작업형 2 오류 pred[:,1]
해당 오류가 뜨는 이유는 무엇일까요,,?from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr,y_tr) pred = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(pred) print(roc_auc_score(y_val, pred[:,1])) [array([[0. , 0. , 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0.01, ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ], ..., [0. , 0.01, 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0.01, 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ]]), array([[0. , 1. ], [0.5 , 0.5 ], [0.71, 0.29], ..., [0.03, 0.97], [0.71, 0.29], [0.19, 0.81]])] --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-41-e325cda04cf0> in <cell line: 3>() 1 from sklearn.metrics import roc_auc_score 2 print(pred) ----> 3 print(roc_auc_score(y_val, pred[:,1])) TypeError: list indices must be integers or slices, not tuple
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 및 평가(분류)
선생님. 해당 수업 자료에서 object 값을 label encoding 시도했는데 이런 오류가 뜹니다.. 혹시 어떤 것이 문제일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 다항회귀분류
2유형 다항회귀분류로 roc-auc로 평가하는 경우는 predict_proba 로 나온 결과값 그대로 제출하나요?이항회귀분류의 경우에는 1인 경우의 확률만 뽑아서 제출했는데, 다항의 경우는 어떻게 되는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관계수 큰 값
상관계수가 -0.4 , 0.3 두개가 있는 경우 ‘상관계수의 절댓값’이 큰 경우를 구하라 하면 -0.4가 맞는데 ‘상관계수의 최댓값’을 구하라고 하면 어떤게 될까요?? 가장 강한 상관관계를 물었으면 -0.4 상관계수가 큰 걸 물었으면 0.3이 맞을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업 노트 보기 코드1
한 번에 풀기로 모델 만들어보고 에러 나오면 수업 노트 보기 코드1에 나와있는 코드로 모델 만들어서 제출하려고 하는데, 검증용 데이터 만드는 부분 없이 코드 제출해도 상관 없나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 답안 제출 관련 문의드립니다.
안녕하세요. 시험환경에서 제2유형 예시를 보면CSV 파일 형식 예시가 첨부파일 처럼 되어 있을 경우,회원ID 없이 아래처럼 제출하면 되는 걸까요? 그리고 답안 제출은result.to_csv('000.csv', index=False) 까지 입력한다음에 제출 버튼 누르면 되는 걸까요?