묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회기출의 작업형2 인강 관련 궁금한점이 있습니다.
[영상 위치]19분 20초 [문의사항]모델 4가지를 선택해서 불러오고 학습하고 predict 를 한 상황인데요, 영상 기준으로 XG부스터가 가장 예측점수가 높게 나온 상황이고, 마지막에 X_test 를 예측할 때 적용되는 model.predict_proba 에서 바로 위에 있는 XG부스터 모델이 선택된걸로 보면 되는거죠? 요약하자면 로지스틱, 의사결정나무, 랜포의 pred 가 아닌 XGB pred값으로 최종 선택된 상황인게 맞는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[MOCK EXAM] T2. EXAM template-캐글 모의고사
강사님 안녕하세요 🙂kaggle에 올려주신 모의 고사 문제 풀이 중인데 모의고사 문제 작업형2에서 RandomForestClassifier로 진행하여 예측 csv를 만들었지만 다른 방법도 시도해보고자 XGBoost도 실행해보니 오류가 뜨더라구요 이 문제에서는 XGBoost 모델링이 힘든건가 하여 질문드려요 😢 # XGBoost(오류) from xgboost import XGBClassifier xgb = XGBClassifier() xgb.fit(X_tr,y_tr) pred = xgb.predict_proba(X_val)[:,1] roc_auc_score(y_val,pred)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩 결과 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요. 피쳐 엔지니어링 원핫인코딩 결과 display 해보면 저는 왜 0, 1 값이 아닌 True, False로 나올까요.. ? 아래 코드입니다. display(c_train.head())는 정상적으로 출력됩니다. # 원핫 인코딩 n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기 display(c_train.head()) c_train = pd.get_dummies(c_train[col]) c_test = pd.get_dummies(c_test[col]) display(c_train.head())
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출6회 작업형3에서 데이터프레임 형성시 오류요ㅠㅠ
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요예측값을 구하려고 데이터프레임을 만들고 있었습니다!숫자라 단순히 숫자만 쓰고 넘어가려고 했는데, 위 사진처럼 오류가 나요...이건 왜그러는 걸까요 ?작업형2에서는 문제없이 되었던것 같은데요ㅠㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
윌콕슨 부호 순위 검정에 대해서
안녕하세요.섹션 6 단일 표본 검정에서 데이터가 정규성을 띄지 않을때비모수검정을 진행하셨는데요.윌콕슨 부호 순위 검정은 평균에 대한 검정이 아니라 중앙값에 대한 검정으로 알고 있습니다.그런데 stats.wilcoxon(df['무게']-120, alternative='less')라고 평균값 120을 무게에서 빼서 진행되었는데 120대신 중앙값을 넣어야 되는것 아닌가해서 질문드립니다.문제 상황에서는 중앙값을 알려주지 않았기 때문에 평균값을 쓴것인지 아니면 윌콕슨 부호 순위 검정에서 평균값을 써도 되는 근거가 있는 것인지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.corr(numeric_only=True)
df.corr(numeric_only=True) 실행하면 사진과 같이 나옵니다. 문제가 뭘까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
listbox 마지막 앞 단어를 구하는 문제
마지막 앞 단어를 구하는 문제에서# listbox[7:8]# listbox[7:-1]# listbox[-2:-1]답을 이렇게 세가지로 알려주셨는데listbox[7]이것도 답이 될 수 있나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫 인코딩 결과가 지속적으로 True False로 나옵니다.
안녕하십니까.작업형 2번 원핫 인코딩 부분을 수강하다가 궁금한 점이 생겨 질문 남깁니다.원핫 인코딩을 한 결과, 값이 0또는 1로 나오는 것이 아닌, True False로 결과값이 출력이 됩니다. 강의 3-6 Regression 파트에서cols = ['sex','smoker','region'] train = pd.get_dummies(train,columns = cols) test = pd.get_dummies(test, columns = cols) display(train.head(2)) display(test.head(2)) 위의 코드를 실행하면 범주형 변수들의 원핫 인코딩 결과가 False, True로 밖에 나오지 않습니다. 혹시 이렇게 두어도 머신러닝을 수행하는데 문제가 없는 것인지, 아니면 반드시 0과1로 바꾸는 작업이 필요한 지 궁금합니다.만약 0과 1로 무조건 바꿔야한다면, 코드에서 어떠한 실수를 했는지 의문이 들어 질문 남깁니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
문제 1번 질문입니다!
안녕하세요! 문제 1번 관련해서 질문이 있습니다. 3번째 질문에 <앞에서부터 70% 데이터를 구하는> 코드를df = df.head(int(len(df)*0.7))위와 같이 head 를 사용해서 풀었는데요. 슬라이싱으로 df = df[:int(len(df) * 0.7)] 하는 것이 더 정확하게 푸는 방법인 걸까요? 아니면 같은 개념이니 둘 다 사용해도 괜찮은 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중회귀분석과 이원분산분석의 차이를 모르겠어요.
다중회귀분석은 독립변수 여러개, 종속변수 하나이원분산분석은 2개 이상의 요인으로 평균 검증 결국에는 둘다 ols사용하는것도 같은데, 두개가 뭐가 다른가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선생님! 4회기출 작업형1-3 between 질문드립니다~
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 4회기출 작업형 1-3번 문제에서 아래쪽 풀이3번을 보고 있는데, 질문있습니다! df['date_added'].between('2018-01-01','2018-01-31')이부분에서 between안의 인자들은 모두 포함인가요 ? 시작일 : 2018-01-01종료일 : 2018-01-31 시작일 종료일 모두 포함 인건지 궁금합니다~!loc,iloc헷갈리듯이 이 함수는 어떤지 알려주세요ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 t1-35 (파이썬) 2번 문제 풀이 부탁드립니다!
안녕하세요~ 캐글 t1-35 (파이썬) 2번 문제 풀이 부탁드립니다!항상 좋은 강의 감사합니다😊https://www.kaggle.com/code/agileteam/t1-35-fb-py
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증용 데이터 분리 후 의사결정나무 모델 적용 시 오류
# 의사결정나무 from sklearn.tree import DecisionTreeClassifier dt = DecisionTreeClassifier() dt.fit(X_tr[cols], y_tr) pred = dt.predict_proba(X_val[cols]) pred[:10]array([[1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.], [1.]])검증용 데이터 분리시 출력 결과가 상이하네요어디를 수정해야 할까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8번문제 groupby로 sum하는 경우
Groupby로 Sum하는 경우, 영상처럼 f2, age, fi, f5, views 열만 나오는게 아니라 id, f3, f4 열도 데이터들이 합쳐져서 나오는데 왜 그런가요?선생님은 숫자값이 적혀있는 열들만 합쳐져서 나오는데 저는 string 값도 더해져서 나오는 것 같습니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 작업형3-1 질문
3-1번을 강의와는 다르게 다음과 같이 작성해봤습니다....답이 다르게 나오던데.. 혹시 어떤 부분이 잘못되었는지 알려주실 수 있나여???※ x_train에는 gender 컬럼 제외시켰고, y_train은 gender컬럼만 입니다. import statsmodels.api as sm x_train = sm.add_constant(x_train) model = sm.Logit(y_train, x_train).fit() print(round(np.exp(model.params['weight']),4))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
dt 에러 질문
앞에까진 잘 됐는데,연/월/일 추출하려고하는데 이런 에러가 뜨는데요 ㅠ왜그런걸까요 ..ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-4 수치형 - 민맥스 스케일링
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 # 수치형 - 민맥스 스케일링 cols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week'] from sklearn.preprocessing import MinMaxScaler scaler = MinMaxScaler() n_train[cols] = scaler.fit_transform(n_train[cols]) n_test[cols] = scaler.transform(n_test[cols])KeyError: "None of [Index(['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss',\n 'hours.per.week'],\n dtype='object')] are in the [columns]"수치형 - 민맥스 스케일링 부분이에서 이러한 에러가 뜹니다..ㅜㅜ해결 방법이 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제 작업1 데이터 불러오기
선생님 모의문제 1을 풀려고 하는데 데이터 members를 불러오는게 이해가 안돼서요ㅜㅜ어떻게 저장한다는 걸까요..? data: members.csv 자체에는 저장하는게 없지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
슬라이싱 할때
선생님! iloc같은경우 인덱스값은 그 앞에 까지 뽑기때문에 +1 해주는 범위까지 설정 해 주는것인데, 컬럼 번호 쓸때는 해당 없는거 같네요?! quiz 2번 푸는데 iloc로 메뉴~할인율 까지 할때 범위를 :3으로 하시길래요! 위에 설명할때는 iloc때 범위를 :로 나타낼 때 마지막을 포함하지 않는다고 하셨는데, 인덱스만 포함하지 않는게 맞는거죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 필사전략 영상에서.. 화면을 못찾겠어요ㅠㅠ
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요.기출문제 빼고 나머지 영상들을 2회독중인 수강생입니다! 캐글 필사전략 영상 아래쪽에 있는 화면으로 들어가서 code부분을 보는데 노션 ?? 이라 적혀있는 화면은 보이지가 않아서요 ..캐글화면 code(1354) 클릭해서 하나씩 찾아가며 보아야 하는것이 맞을까요 ? 어떻게 서칭할수 있는지요ㅠㅠ영상에서 진행하고 있는 T1-7 값변경 및 2개 이상의 조건을 서칭해서 화면으로 들어왔는데, 데이터셋을 받는 화면이 안나와요😂😂😂😂 너무 기초적인 질문이라 죄송합니다.. 어떻게 하면 될까요~?