묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정답제출
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 b.sort_values(ascending = False).index[0] 위와 같이 index[0]로 추출하여 제출하지말고 눈으로 정렬된 결과를 보고 print('smoothness error')로 제출해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측값 처리 관련 궁금합니다
결측값을 찾아 다른값으로 대체하는 등의 문제를 풀때 df[‘f3’].fillna(0)또는 넘파이 이용해서 df[‘f3’].replace(np.nan,0) 두개는 완전히 같은 기능인가요? 3번은 후자로 풀이해주셨는데 fillna 가능한지 궁금합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train test 합쳐서 인코딩후 나누기
train, test 데이터의 범주형 카테고리가 다르다고 가정하고무조건 데이터를 합쳐서 인코딩후 다시 train, test 로 나누는 절차로시험 준비를 해볼까 생각이 드는데요선생님 의견이 궁금합니다
-
미해결[핵집] 2024 빅데이터 분석기사(실기)_작업형 1·2·3유형
강의자료 요청드립니다.
- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요! - 먼저 유사한 질문이 있었는지 검색해보세요. - 서로 예의를 지키며 존중하는 문화를 만들어가요. - 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요. kum0621@naver.com 으로 자료 요청드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상 강의와 똑같은 수식을 적은것 같은데 오류가 납니다.
데이터 핸들링을 위한 판다스 기초 1 동영상 강의에서 df.corr이나 car.nunique 수식을 작성할 때 에러 메세지가 뜹니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
동영상을 보면서 실습은 못하는건가요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀 rmse
회귀실습 따라하던 중 이런 오류가 떴는데 어떻게 해결해야할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
에러메세지와 마주하기 에러 4번
9분 09초영상과 노트북의 코드가 다른데요# 풀이 코드 # X_train, y_train, X_test 3개 파일이 주어졌을 때 from sklearn.datasets import load_wine wine = load_wine() df = pd.DataFrame(wine.data, columns=wine.feature_names) df['target'] = wine.target from sklearn.model_selection import train_test_split X_train, X_test, y_train, _ = train_test_split(df.drop('target',axis=1), df['target'], test_size=0.2, random_state=2022) # 만약 'proline'컬럼의 값이 1500 일때 이상치라고 판단해 삭제 했다면? print("1500이상인 데이터 수:", sum(X_train['proline'] >= 1500)) # 삭제할 데이터의 인덱스 값을 구하고 drop함수를 통해 삭제 ind = X_train[X_train['proline'] >= 1500].index print("삭제할 index:", ind) X_train = X_train.drop(ind) # 기본값 axis = 0 y_train = y_train.drop(ind) from sklearn.ensemble import RandomForestClassifier model = RandomForestClassifier() model.fit(X_train, y_train)(질문1 )X_train에 y_train를 합친뒤 이상치를 삭제하는 것보다 각각 개별로 삭제하는게 더 간단해서 수정한건가요?(질문2) df 에서 이상치를 제거한 후에 train_test_split 으로 데이터를 나눠도 되는건가요?
-
미해결[핵집] 2024 빅데이터 분석기사(필기)_과목 3~4
해당 Ppt 교안 자료(3~4) 요청
안녕하세요.alsrbsdl5@naver.com으로 강의 교안 발송 부탁드립니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 csv파일 제출
안녕하세요 강사님 갑자기 작업형 2유형 csv 파일 제출할때 혼동이 생겨 질문합니다다름이 아니라 시험환경 문제 풀이중 roc_acu로 평가 한다고 되어 있어 predict_proba로 예측값을 뽑아 제출하면 된다고 생각했지만 csv 제출 파일 예시에는 이렇게 나와있어 이런 경우에는 predict으로 예측값을 뽑아 제출하는건가 하여 혼동이 와 질문드립니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[7회 작업형3 문제1-3] target을 test에서 pop하는 이유를 잘 모르겠습니다
model = logit('gender ~ weight', data=train).fit() target = test.pop('gender') target = test.pop('gender') <- 이 부분에서 왜 target을 test에서 pop하는지 잘 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
결측치 채우기/ 삭제
빅분기 시험 볼때, 결측치 채우기/ 삭제에 대해서, 정리하면,결측치 채우기 : train, test data 모두 적용결측치 삭제 : train data 가능/ test data 불가능 (컬럼은 가능하나 train, test 데이트의 행(개수) 일치시켜야 함이렇게 이해한 것이 맞을까요? ^^;;
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
랜덤포레스트와 xgb
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요평가할 때rf = RandomForestClassifier()rf.fit()rf.predict()이 부분에서 rf를 다 model로 적어줘도 상관없나요? model = RandomForestClassifier()model .fit()model .predict()또한, 랜덤포레스트에서 model를 변수명으로 해서 돌리고 xgboost에서도 똑같이 model를 변수로 두고 돌려도 되는지 여쭤봅니다. 이전 강의인 회귀파트에서는 모델에 따라 변수명을 다르게 하지 않고 다 같은 model로 변수명을 두었더라구요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-1 작업형2 모의문제1 강의 내용 질문
안녕하세요. 선생님해당 강의에서피처엔지니어링을 위해 베이스 라인(수치형 데이터만 사용해보기) 만드는 과정에서선생님께서는cols = train.select_dtypes(include="O").columnstrain = train.drop(cols, axis=1)test= test.drop(cols, axis=1)로 하셨는데요. train = train.select_dtypes(exclude="O")test = test.select_dtypes(exclude="O") 로 해도 문제 없을까요? drop() 메소드로 cols 변수에 넣은 칼럼을 axis=1 로 전부 제거한거니까그냥 범주형 데이터를 제외 시키는 select_dtypes(exclude="O") 으로 해도 문제 없을 것 같긴 한데, 확인차 질문 글 남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.drop 사용시 에러 발생
선생님, df.drop("시즌", axis = 0) 으로 작성하면 에러가 안뜨지만df.drop("시즌", 0) 으로 작성하면 다음과 같은 에러메세지가 뜹니다.이유를 알 수 있을까요?|DataFrame.drop() takes from 1 to 2 positional arguments but 3 were given
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주어진 csv파일이 2개일때와 3개일때 차이가 궁금합니다
csv 파일이 주어질때 train, test 2개 주어질때와X_train , y_train, X_test 3개 주어질때간단하게 생각하면 X_train,y_train 데이터로 나눠있는 데이터를 train으로 나누지 않고 주어졌다고 생각하면 될가요? 2개로 주어졌을때는 타겟값만 pop으로 빼내고3개일때는 train값을 합쳐서 결측치, 전처리 하면 될가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-1 7회 기출 유형(작업형1) 문제 2번에서
시험장에서 아래와 같이 풀이해도 괜찮을까요?loc를 사용하지 않고 df["DE14"]를 입력해서 구해도 괜찮은지 궁금합니다! # DE1~DE77컬럼 중 주가지수의 종가 "close"와 가장 상관관계가 높은 변수를 찾아 abs(df.corr()["close"]).sort_values(ascending = False) # 해당 변수의 평균값을 구하시오. (반올림하여 소수 넷째자리까지 계산) print(round(df["DE14"].mean(),4))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링 질문드립니다
안녕하세요 강사님강의 풀이 중 궁금한게 있어서 질문드립니다! 강의에서 object 타입의 대해서만 encoder 하고,int, float 타입에 대해서는 별도의 scaler 작업을 안하신 것 같은데 혹시 스케일링 작업은 필수가 아닌가요?? 성능만 잘 나오면 생략해도 무방한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-3 7회 기출 유형 작업형3 문제1-2에서 glm 대신 logit을 사용해도 되나요?
glm 대신 logit을 사용해도 되나요? 아래와 같이 입력하면 model. summary 결과에 deviance 값이 없는데, 문제에서 로지스틱 회귀 모델을 적합시키라고 했는데 어떨때는 logit을 사용하고, 어떨때는 glm을 사용해야 하는지 모르겠습니다!from statsmodels.formula.api import logit model = logit("gender ~ age + length + diameter + height + weight", data = train).fit() model.summary()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 : R2 SCORE / ID 삭제
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요~작업형2 모의문제2 : 에어비엔비 가격예측에서 2가지 질문드립니다. 작업형2 모의문제1에서는 CLIENTNUM로 인해서 과대적합 가능성이 있다고했는데 이번에는 id는 남겨놓고 host,name 등만 삭제하셨더라구요. 이번엔 ID를 남겨놓은 이유가 있을까요? R2 score 값이 1에 가까울수록 좋은 모델이라고 알고 있었습니다. 질문을 찾아보니 모델 점수에 연연하지 말라고 하셨는데, 그래도 R2 SCORE값이 -값이 나오거나 0.01 정도로 나오면 시험볼 때 많이 불안할 것 같더라구요.. - 값이나 0.01 정도로 나와도 괜찮은 건가요?