묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 스케일링
범주형 변수를 라벨인코딩 후 수치형변수와 같이 스케일링을 진행하였는데 문제가 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2 MAE값 질문
수치형 변수는 minmaxscaler, 범주형 변수는 라벨인코딩을 사용했고모델은 randomforestregressor를 사용하였습니다.max_depth나 n_estimator는 바꿔봐도 기본값과 큰차이 없거나 MAE값이 더 올라가서random_state값만 지정해주고 따로 튜닝은 하지 않았습니다. 다른분들 후기를 보니 범주형 변수중에 name컬럼은 유니크값이 2개여서 name컬럼은 원핫인코딩, 나머지는 라벨인코딩 하신분들이 계시더라구요. 저는 MAE값이 116정도로 나왔고 이대로 제출했는데 다른분들은100대로 나오신분들이 많이 계신거 같아서 혹시 감점요소가 있을지 궁금합니다.
-
미해결
빅분기 8회 실기 유형2 LinearRegression으로 하신 분 있나요?
사이킷런의 선형회귀로 해도 모델 돌아가던데...(from sklearn.linear_model import LinearRegression)mae는 확인을 못하고 음수값이 꽤 pred에 있던 걸로 기억하거든요..시간 없어서 그냥 제출해버렸는데...랜덤포레스트리그레서나 xg부스트리그레서 등이 있었군요...공부가 부족해 시험 당일 전혀 생각도 못하고...ㅠㅠ보니까 lightdm???이라는 모델들도 많이 사용하셨더라고요?이것도 pre에서 음수값이 나온 경우가 있다 그러셔서...조금 희망을 가져보는데...저는 40점 중에 몇점이나 받을 수 있을까요 ㅠㅠ넘 심경 쓰여요 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형2 질문
안녕하세요.8회 작업형 2 관련해서 회귀문제라서1.수치형 변수에 대해 minmaxscaler2.범주형 변수에 대해 원핫인코딩 후3.RandomForestRegressor(random_state=0) 학습결과를 제출했는데 적합한 모델로 돌린것인지 궁금합니다* random_state=0 미작성시 mae값이 더 좋았는데 다시 생각해보니 에러값이라 작을 수록 좋은데 헷갈려서 '0' 적용한 값으로 제출했네요 결과 제출 시에는test 데이터 행 개수 2064개 동일한것은 확인하였고sklearn.metrics import mae 적용한값이 0.0000*** 소수점으로 출력된것으로 기억하는데다른 분들 93,94는 아니었던 것 같아서 이런경우에는 오답처리되는 것인지 문의드립니다;;
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 작업형 2번 시험에서
강의해주신 내용/ 기출분석이랑 굉장히 비슷했던 거 같아서시간관계상 MAE도 돌려보지못하고..그냥 result 저장하고 제출했는데 ㅠ 랜덤포레스트 회귀/원핫인코딩/칼럼수는 2064개 인가로 문제없었구요, pred는 잘 출력되었습니다. 문제가 될까요?ㅠㅠ MAE로 확인도 못해봤네요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 답안제출 시
선생님, 이번 실기문제 중 작업형2에 평가지표가 mae로 나왔는데 에러 값이면 최소값을 해야하는데 모델 3가지를 실행 후 최대값으로 제출해버렸는데, 다른 사항들은 다 조건에 맞춰도 아예 0점 처리되나요??...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2유형 관련 문의드립니다.
안녕하세요 선생님.작업형 2유형 답안 제출 관련 문의 드립니다.작업형 2유형 문제를 해결하면서 선생님이 알려주신 단계대로 차근차근 진행하여 csv예측 파일까지 잘 작성했습니다.마지막에 작성된 csv파일을 확인하는 Print(pd.read_csv("result.csv))구문만 빼고 전 단계의 print구문은 다 주석처리 하고 마지막에 최종 1회만 제출했습니다.앞 단계의 print구문들은 주석처리 하여도 제가 작성하였던 코드만 실행된 상태로 제출되면 감독관이 체점하는대는 아무 문제 없는게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 분석가? 공부방향 문의
안녕하세요. 강사님 수업듣고 큰 도움을 받은 수강생입니다. 먼저 감사하다는 말씀드리고 싶네요.비전공자로 막연한 관심에 파이썬이 뭔지 궁금해하다가 빅데이터 분석기사 시험이 파이썬으로 할수있다는 정보를 알게되고, 시험응시를 하면서 공부해볼 수 있겠구나 싶어서 시작해봤습니다.막상 꾸준히 공불못해서 필기도 실기도 벼락치기하면서 시험을 치뤘지만, 앞으로 데이터분석가 수준으로 조금 더 딥하게 공부해보고 싶은 마음이 생겼습니다.강의에서 캐글, 데이터분석 대회, 스터디 참여 등을 추천해주셔서 해보려고 합니다. 대신 조금만 더 구체적으로 파이썬을 활용하거나 꼭 그렇지않더라도 딥러닝 영역까지 학습하고 숙련할 수 있는 방법론에 대한 의견을 여쭙고 싶습니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
lightgbm 예측값 오류?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이번 시험에서 작업형2 문제 풀이 과정입니다 Test 데이터에 총 3개의 범주형 컬럼이 존재 하였습니다. 월, 요일, 네임 이때 각 고유값은 12,7,2 여서 따라서 월과 요일은 라벨인코딩 / 네임은 겟더미즈 로 각각 하였습니다. 이후 모델 성능을 비교파기 위해 랜덤포레스트와 라이트지비엠을 사용 하였습니다. 랜포리그레서로 학습시키고 예측할 땐 random_state 만 고정한채 mae로 평가하였더니 140 정도였고 XGBM리그레서로 학습시키고 mae로 평가하니 108 정도 나왔습니다. 이때도 딱히 하이퍼 파마미터튜닝은 진행하지 않았습니다. 따라서 test 데이터를 xgbmregressor에 적용하여 예측한 결과를 제출하였습니다. 다만 여기서 lightgbm 을 사용하신 분들이 랜덤포레스트에서는 없었던 음수값이 예측에 나왔다고 하는데, 전처리를 동일하게 하고 평가도 좋게나온 모델의 결과가 저렇게 오류로 나올 수가 있나요..?그냥 남들 다 쓰는 랜포 쓸걸 괜히 lightgbm 알아서 쓴거 같다는 기분이 듭니다 ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번 빅분기 실기 8회 (오즈비 관련)
이번 시험에서 오즈비가 또 나왔습니다. 지난 시험에서는 특정 변수값이 1 증가할때의 오즈비를 구하라고 나와서 다음과 같이 구했었습니다. import numpy as npnp.exp(계수) --> 답 이번 문제에서는 특정 변수값이 5 증가할때의 오즈비를 구하라고 나왔습니다.그러면 답이 아래와 같나요? np.exp(5*계수)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅데이터분석기사 실기 작업형 2
안녕하세요.8회 빅데이터분석기사 실기 작업형 2에서 다른 모델들보다 xgboost 패키지에 XGBRegressor가 성능이 훨씬 좋길래 그 모델을 사용해서 제출했습니다.Future Warning이 나왔지만 별 생각하지 못하고 제출했는데, 시험장 나오고 나서 생각해보니 너무 욕심이었나 생각이 듭니다.결과 파일을 제출한 후, 다시 파일을 확인했을 때, 이상은 없었습니다만 Warning이 나오면서 코드를 다시 확인하라는 메세지가 있어서 혹시 몰라 질문드립니다.아시는 분은 꼭 답변 부탁드릴게요.감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 빅분기 실기 2유형 시험간 헷갈리는 부분
MinMaxScaler + one-hot encoding lightgmb(n_estimator = 300) +mae 사용하여 예측하였는데 (mae : 93~94) 예측값이(인원수) 2096개(?)중에서 음수가 11개 나오더라고요.이렇게 예측값이 양수가 나와야하는 경우 보통 음수에 대해 후처리를 한번 더 해서 내보내는건지, 아니면 상관이 없는건지 궁금합니다...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 시험 작업형2
선생님 제가 풀었을때는 pred값이 소수 셋째자리까지 나오는데 시험 제출예시에서는 깔끔하게 정수로 되어있길래 마지막에 pred.astype(int)로 바꿔서 제출했는데 혹시 문제될까요 ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 답 복기
작업형1313 / 239 / -0.026 작업형2lightgbm 하이퍼파라미터튜닝으로mae 92정도 작업형3-(1)12 / -0.456 / 7.919 작업형3-(2)2.129 / 0.313 / 104.873 랜포보다 lgb가 성능이 더 좋길래 썼는데 나중에 pre 데이터 min값 찍어보니 음수 나오더라구요 ㅠ 이러면 감점 혹은 0점 처리될까요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험후기
기억나는 문제 쭉 적어 봅니다. 유형1 3번민맥스 정규화 라고 나와서 당황 했는데그냥 민맥스 스케일로 풀었습니다 ㅎㅎ 유형2mae로 평가하는 회귀문제원핫인코딩만 하고 랜덤포레스트 돌렸을때mae값 93? 95? 쯤 나와서 그냥 제출했습니다. 유형3-1로지스틱 회귀문제유의하지 않은 변수가 몇개인지 쓰는문제2.1에서 나온결과 유의한 변수로 로지스틱 모델 다시 만든 회귀계수 값 평균 만들기시험푸는 중간에 알림으로 ???가 유의하면 포함해서 계산? 하라는내용이 왔습니다.그래서 절편? 도 포함해서 계산했는데 맞는지 모르겠네요.. 새로운 값을 넣어서 값을 예측하는 문제3-2.특정변수 가 5 변할때 오즈값이 얼마나 변하는지?오즈비 구해서 *5 해버렸습니다.. 맞을지 모르겠네요합격했으면 좋겠습니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 , 3유형 코드제출 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요좋은 강의 덕분에 오늘 시험을 잘마쳤습니다!다만 시험을 끝내고 결과확인을해보니답안은 모두 제출하였습니다만…작업형 1/3유형 풀이 (코드) 부분이 미제출로 나와서 이부분이 문제가 되지 않을까 걱정되어 문의 드립니다. 혹시 코드가 제출더ㅣ지 않으면 문제가 될까요?
-
미해결빅데이터분석기사 실기대비 (R 활용)
이번시험 작업형2 질문
이번시험작업형2유형 rpart랑 glm만 써서 똑같이 더하고 2로 나눠서 제출했는데 몇점정도 나올까요??작업형 2유형 30점밑이면 불합이라서요mae값은 대충 400~500때에여
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 - 작업형2
fit 전까지는 잘 실행되었는데 저기서부터 막히네요 ㅠㅠ unknown label type: continuous는 뭘까요,,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
작업형2에서 rmse 반복문을 못쓸거 같은데 그냥 sklearn에서 mse 불러와서 **0.5만 써서 프린트해도 될까요,,, ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 2회 작업형 2 오류 pred[:,1]
해당 오류가 뜨는 이유는 무엇일까요,,?from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr,y_tr) pred = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(pred) print(roc_auc_score(y_val, pred[:,1])) [array([[0. , 0. , 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0.01, ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ], ..., [0. , 0.01, 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0.01, 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ]]), array([[0. , 1. ], [0.5 , 0.5 ], [0.71, 0.29], ..., [0.03, 0.97], [0.71, 0.29], [0.19, 0.81]])] --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-41-e325cda04cf0> in <cell line: 3>() 1 from sklearn.metrics import roc_auc_score 2 print(pred) ----> 3 print(roc_auc_score(y_val, pred[:,1])) TypeError: list indices must be integers or slices, not tuple