묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험후기
기억나는 문제 쭉 적어 봅니다. 유형1 3번민맥스 정규화 라고 나와서 당황 했는데그냥 민맥스 스케일로 풀었습니다 ㅎㅎ 유형2mae로 평가하는 회귀문제원핫인코딩만 하고 랜덤포레스트 돌렸을때mae값 93? 95? 쯤 나와서 그냥 제출했습니다. 유형3-1로지스틱 회귀문제유의하지 않은 변수가 몇개인지 쓰는문제2.1에서 나온결과 유의한 변수로 로지스틱 모델 다시 만든 회귀계수 값 평균 만들기시험푸는 중간에 알림으로 ???가 유의하면 포함해서 계산? 하라는내용이 왔습니다.그래서 절편? 도 포함해서 계산했는데 맞는지 모르겠네요.. 새로운 값을 넣어서 값을 예측하는 문제3-2.특정변수 가 5 변할때 오즈값이 얼마나 변하는지?오즈비 구해서 *5 해버렸습니다.. 맞을지 모르겠네요합격했으면 좋겠습니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 , 3유형 코드제출 여부
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요좋은 강의 덕분에 오늘 시험을 잘마쳤습니다!다만 시험을 끝내고 결과확인을해보니답안은 모두 제출하였습니다만…작업형 1/3유형 풀이 (코드) 부분이 미제출로 나와서 이부분이 문제가 되지 않을까 걱정되어 문의 드립니다. 혹시 코드가 제출더ㅣ지 않으면 문제가 될까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 7회 - 작업형2
fit 전까지는 잘 실행되었는데 저기서부터 막히네요 ㅠㅠ unknown label type: continuous는 뭘까요,,
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse
작업형2에서 rmse 반복문을 못쓸거 같은데 그냥 sklearn에서 mse 불러와서 **0.5만 써서 프린트해도 될까요,,, ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 2회 작업형 2 오류 pred[:,1]
해당 오류가 뜨는 이유는 무엇일까요,,?from sklearn.ensemble import RandomForestClassifier rf = RandomForestClassifier(random_state=0) rf.fit(X_tr,y_tr) pred = rf.predict_proba(X_val) from sklearn.metrics import roc_auc_score print(pred) print(roc_auc_score(y_val, pred[:,1])) [array([[0. , 0. , 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0.01, ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ], ..., [0. , 0.01, 0. , ..., 0. , 0. , 0. ], [0. , 0. , 0. , ..., 0.01, 0. , 0. ], [0. , 0. , 0. , ..., 0. , 0. , 0. ]]), array([[0. , 1. ], [0.5 , 0.5 ], [0.71, 0.29], ..., [0.03, 0.97], [0.71, 0.29], [0.19, 0.81]])] --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ipython-input-41-e325cda04cf0> in <cell line: 3>() 1 from sklearn.metrics import roc_auc_score 2 print(pred) ----> 3 print(roc_auc_score(y_val, pred[:,1])) TypeError: list indices must be integers or slices, not tuple
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모델링 및 평가(분류)
선생님. 해당 수업 자료에서 object 값을 label encoding 시도했는데 이런 오류가 뜹니다.. 혹시 어떤 것이 문제일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 다항회귀분류
2유형 다항회귀분류로 roc-auc로 평가하는 경우는 predict_proba 로 나온 결과값 그대로 제출하나요?이항회귀분류의 경우에는 1인 경우의 확률만 뽑아서 제출했는데, 다항의 경우는 어떻게 되는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
상관계수 큰 값
상관계수가 -0.4 , 0.3 두개가 있는 경우 ‘상관계수의 절댓값’이 큰 경우를 구하라 하면 -0.4가 맞는데 ‘상관계수의 최댓값’을 구하라고 하면 어떤게 될까요?? 가장 강한 상관관계를 물었으면 -0.4 상관계수가 큰 걸 물었으면 0.3이 맞을까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업 노트 보기 코드1
한 번에 풀기로 모델 만들어보고 에러 나오면 수업 노트 보기 코드1에 나와있는 코드로 모델 만들어서 제출하려고 하는데, 검증용 데이터 만드는 부분 없이 코드 제출해도 상관 없나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
제2유형 답안 제출 관련 문의드립니다.
안녕하세요. 시험환경에서 제2유형 예시를 보면CSV 파일 형식 예시가 첨부파일 처럼 되어 있을 경우,회원ID 없이 아래처럼 제출하면 되는 걸까요? 그리고 답안 제출은result.to_csv('000.csv', index=False) 까지 입력한다음에 제출 버튼 누르면 되는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
하이퍼 파라미터 튜닝 시 질문드립니다!
안녕하세요 강사님!하이퍼 파라미터 튜닝 시 궁금한게 있어서 질문드립니다! train_test_split() 으로 데이터를 분리해서 모델 성능을 검증할 때, 하이퍼 파라미터 중 max_depth 값을 1을 줬을 때 검증에서는 성능이 제일 좋게 나오는 경우 1 값 그대로 줘도 괜찮나요?? 뭔가 max_depth=1 은 실제 값을 예측 할 때 좀 위험(?)하지 않을까 하는 의문이 들어서 질문드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[심화] 시계열 데이터 2
선생님 timedelta 자료형에서시간 컬럼끼리 - 연산자는 되는데더하거나, 곱하거나, 나누기는 안되더라구요. 혹시 -만 가능한걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러코드.
이유좀 알려주세요!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2, 원핫인코딩
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요예시문제 작업형2에서 원핫인코딩(pd.get_dummies)를 하고 작업형 2 한가지 방법으로 문제 풀기를 하면 오류가 발생합니다train과 test의 object인 주구매상품의 유니크 수가 달라서 그런간가요? 유니크 수가 다른 경우 그 컬럼만 삭제하고 작업형2 한가지 방법으로 풀기와 동일한 흐름으로 문제를 풀어도 될까요?(아래 첨부한 코드처럼요!)train = train.drop(['주구매상품'], axis=1) test = test.drop(['주구매상품'], axis=1) print(train.shape, test.shape) train = pd.get_dummies(train) test = pd.get_dummies(test) print(train.shape, test.shape)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험볼때 2유형부터 풀수 있나요?
시험볼때 순서대로 1유형의 1번부터 풀어야 하는지 아니면 자기가 편한 순서대로 풀수 있는지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 관련 질문
작업형3에 크게 두 문제가 있는데 부분점수가 있나요?ex) 1-1 O, 1-2 X, 1-3 X / 2-1 X, 2-2 X, 2-3 X1-1만 정답이고 나머지는 틀렸다면 부분점수가 있나요?!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 3 - 로지스틱 회귀 질문입니다.
위 문제에서, 독립변수로 income, 종속변수로 purchase 를 사용해 logit 로지스틱 회귀 모델을 만들어 학습하고나서, 예측을 할 때, test 의 test["income"] 을 predict( ) 함수 안에 넣어야 하는거 아닌가요?캐글 풀이에서는 test 전체를 넣어서 혼란이 옵니다. 그리고 이 문제에서 모델의 유의확률을 구하라고 했는데요.특정 독립변수의 PVALUE 가 아니라 모델의 P VALUE 이므로 위 model.summary() 에서 오른쪽 아래 쯤에 있는 LLR p-value 아닌가요?이 문제에서는 단순선형회귀라서 독립변수 income 의 p value와 LLR-P value 가 같긴 합니다만,만약 독립변수가 여러 개 이고, 모델의 pvalue를 구하라고 하면 LLR- P VALUE 가 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 질문입니다
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 test데이터 예측할 때, train데이터를 훈련용과 검증용데이터로 분할해서 모델 검증하고 train데이터 전체로 모델 다시 학습해서 test데이터 예측하는 걸로 알고 있는데 다른 예시들 보니까 train데이터 분할해서 만든 모델로 그대로 test데이터 예측하시던데 상관 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2
타겟값이 범주형일 때, 라벨인코딩 하기 전에 target=train.pop()을 통해서 타겟컬럼만 따로 빼주셨는데train.drop('Heat_Load',axis=1).select_dtypes(include='O').columns을 이용하여 컬럼값을 변수에 저장해놓고 라벨인코딩을 하는 것도 상관없는지 궁금하여 여쭈어봅니다 !!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
유니크 값이 다를때
유니크 값이 다를때는 라벨인코딩을 사용하면 상관없는건가요?