묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
테스트 데이터 전처리 시 범주형, 수치형에 따른 차이가 있나요?
위와 같이 작성해주신 코드를 보는 중 의문이 생겨 질문 남깁니다!train 데이터를 전처리할 때에는 train데이터의 최빈값, 중앙값, 평균으로 결측치를 대체하는데 반해,test 데이터 전처리 시 범주형 데이터는 test 데이터의 최빈값으로 대체/ 수치형 데이터는 train 데이터의 평균, 중앙값으로 대체하고 있습니다. 왜 test 데이터 처리 시 train/test 데이터 모두 다 사용하나요? 일관성 있게 하나만 사용해서는 안되는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 3 문제 8
df.groupby(['city','f2']).sum().reset_index() 이 코드문을 작성했을떼 id, f3과 같은 문자열 데이터도 같이 들어가서 선생님께서 하신 코드와 다르게 나옵니다. 그래서 따로 숫자형 데이터만 묶어서 그룹을 만든 다음 해결을 하긴 했는데, 선생님과 똑같이 했을땐 왜 같게 안나오는건지, 버젼이 바뀐건지 궁금해 여쭤봅니다
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
ANOVA 질문드립니다
안녕하세요,독립표본검정 시 정규성을 만족하나 등분산성을 만족하지 않는 경우 equal_var = False라는 파라미터를 추가한다고 가르쳐주셨는데요,분산분석에서도 정규성은 만족하였으나 등분산성을 만족하지 않는 경우 추가해야 하는 조건이 있는지 문의드립니다.학습에서 정규성을 만족하지 않을 경우 kruskal-wallis 비모수검정을 활용한다고 말씀해주셨는데, 등분산성을 만족하지 않는 경우는 설명이 되지 않은 듯 해서요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
MinMaxScaler 에러
안녕하세요. MinMaxScaler하는데 qsec을 인지하지 못했다는 에러가 뜨네요. 어떤 부분이 잘 못 되었는지 알 수 있을 까요?자료는 df=pd.read_csv("mtcars.csv")코드를 통해 내려받아서 head확인하였습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.
RandomForestRegressor 실행할때 마다 성능평가값이 달라집니다.반복해서 실행하니, 처음보다 유의미하게 수치가 낮아졋습니다.강의에서는 스케일링 한거 보다 베이스라인이 성능평가가 더 낫다고 하는데, minmaxsclaler 를bmi 만 한 성능평가 수치가 가장 좋습니다.질문1) 랜덤포레스트는 원래 돌릴때마다 성능이 좋아지나요? 질문2) 시험환경에서는 랜덤포레스트를 반복해서 실행하면 안되나요? (성능평가 결과가 좋아져서 신뢰성 하락이 되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
세션 6-1) 모델 & 평가 문의
안녕하세요? 선생님.모델 평가 시에, 랜덤포레스트/레이블인코딩/원핫인코딩을 모두 돌려보시더라고요..실제 시험에서도 이렇게 진행을 해서 최적의 값을 찾는지, 아니면 유사하다면 하나로 암기해서 시험을 치뤄도 되는지 문의드리고 싶습니다. 정확도가 얼마 이상 나오는 모델이라는 기준이 따로 없어 궁금합니다 😄
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼리스트 반복실행시 오류
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
print 시 float, int
문제 1번의 답은 float형이고 2,3번이 답은 int형인 것을 보고 궁금한 점이 생겼습니다. 1번 답 역시 3261.0 으로 Int로 나타낼 수도 있는 값인데, 실제 시험 볼 때에 출력되는 데이터타입도 고려해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀계수 중 가장 큰 값 구할 때 상수항도 포함해야 하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요케글 https://www.kaggle.com/code/agileteam/t3-regression-py 이 주소의 문제 1번에서 회귀계수 중 가장 큰 값을 구하라고 하였는데, 상수항도 포함인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험장 환경 질문입니다.
안녕하세요 강의 노트북을 통해 colab에서 빈칸을 채우다 보면 자동완성 기능으로 힌트를 제공받는데요, 시험장 환경에서도 동일하게 자동완성으로 힌트가 제공되는것인가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sum 사용시 numeric_only=True
안녕하세요 선생님,새소식에 이제 sum 사용시 numeric_only=True 작성이 필요하다고 했는데sum을 사용하는 모든 항목에서 아래와 같이 사용하면 되는건가요?sum(numeric_only=True) 간단하게 합계를 구할때도 .sum(numeric_only=True)로 작성을 해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
가설검정 유의수준
안녕하세요, 혹시 가설검정 (ttest, correlation, anova) 에서 유의수준 0.05가 아닌 0.01, 0.10 등으로 수정하고 싶을 경우 어떤 파라미터를 추가하면 될지 문의드립니다.
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6-1 sort_values를 통해 눈으로 확인한 후 print문으로 정답을 도출해도 될까요?
# sort_values를 통해 눈으로 확인한 후 print문으로 정답을 도출해도 될까요? a=pd.to_datetime(df['출동시간']) b=pd.to_datetime(df['도착시간']) df['seconds']=(b-a).dt.seconds df.groupby('소방서')['seconds'].mean().sort_values(ascending=False) print(round(4839.533333/60))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수강 연장 문의
안녕하세요~수강이 11월 25일 만료인데 11월 30일까지 연장 가능할지 문의드립니다.seraut@naver.com
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
한가지 방법으로 풀기 오류
ValueError: The feature names should match those that were passed during fit. Feature names unseen at fit time:Feature names seen at fit time, yet now missing: 원핫인코딩 후 타겟 설정후 한가지 방식으로 풀기와 동일하게 진행했는데pred=model.predict(test) 위와 같은 문제가 발생되는데 이유가 무엇일가요? 실제시험때는 문제없었거든요 원인 및 답변 방안 문의드립니다 train=pd.get_dummies(train)test=pd.get_dummies(test)from sklearn.model_selection import train_test_splittarget=train.pop('TotalCharges')X_tr, X_val, y_tr, y_val = train_test_split(train,target,test_size=0.2,random_state=0)print(X_tr.shape, X_val.shape, y_tr.shape, y_val.shape)from sklearn.ensemble import RandomForestRegressormodel=RandomForestRegressor(random_state=0)model.fit(X_tr,y_tr)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의고사 3에서 평가 값이 강의내용이랑 달라요
강의 내용 그대로 코딩했는데 평가 값이 다를 수 있나요?강의에서는 xgb에서 max_depth 값을 키울수록 평가값이 커졌는데 제가 했을 땐 값을 키울수록 평가결과가 작아져서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀분석 및 사후검정
안녕하세요 선생님,회귀분석 ols(종속변수~독립변수, data=df).fit()위 코드에서 fit()은 반드시 넣어줘야 하는 부분인가요? 머신러닝이 아닌 회귀분석을 실시할 때 학습(fit)을 시키는 것이 생소하기도 하고... R과 코드가 유사하다고 하셨는데 R에서는 fit()을 사용하지 않았던 것 같아서 조금 헷갈립니다. 챗gpt에 물어보니 fit()을 호출하지 않으면 회귀모델을 정의만 할 뿐 실제 계산이나 검정이 되지 않는다고 설명하던데.. 그럼 여기에서는 fit을 '학습'보다는 '분석'이라고 이해해도 될까요? 분산분석사후검정(투키와 본페로니)은 df_melt(데이터 재구조화)에서만 작동하나요? 아래와 같이 df['A'] 등 집단을 쭉 입력하면 안되는 것 같아서요tukey_result = pairwise_tukeyhsd(df['A'], df['B'], df['C'], df['D'], alpha=0.05)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
roc_auc_score
왜 이런 오류가 나오는걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2유형 피처 엔지니어링
선생님, 수업 잘 들었습니다.퇴근 후에 아무래도 시간이 많지는 않아서 조금 더 간단하게 풀이할 수 있게 준비를 하고 싶은데피처 엔지니어링을 할 때 항상 아래 두 가지 방법을 동시에 사용해서 수치형과 범주형 컬럼들을 동시에 사용해도 문제가 없을까요? 수치형 : 스케일링범주형 : 인코딩
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출유형(작업형3) 문제풀이
안녕하세요, 해당 영상 11분 7초에서 rsquared 함수를 사용하시던데, 문제에서 '적합한 모델의 결정 계수'라고 하였으니 rsquared_adj 함수를 사용해야 하지 않나 해서 질문드립니다!