묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨데이터분석 준전문가(ADsP) 자격증 대비
교재 문의
안녕하세요? 강의를 결재하고 수강을 하려하는데요~교재구매는 어떤 방식으로 하는지에 대해서 문의드립니다. ^^
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Kaggle 작업형 2유형 T2-3 성인인구조사 소득 예측
선생님 최종적으로 csv 파일에 id, income 칼럼만 불러오게 되야하는데 자꾸 저는 unnamed: 0 와 id, income 칼럼이 같이 출력이 되네요 ㅠㅠ 그냥 이렇게 답안 제출해도 괜찮나요??평가지표에 따라서 점수를 보니 거의 0.85라서요!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
학습용/검증용 데이터 구분
# 학습용 데이터와 검증용 데이터로 구분 from sklearn.model_selection import train_test_split y = (y_train['income'] == '>50K').astype(int) X_tr, X_val, y_tr, y_val = train_test_split(X_train, y, test_size=0.1, random_state=2022) 이 부분이 이해가 잘 가지 않아요. X_tr, X_val, y_tr, y_val 이렇게 4개에 지정하는데, test_split은 X_train, y 이렇게 두개만 들어가고.. y_train이 아닌 y만 넣는 이유도 모르겠습니다 ㅠ
-
미해결빅데이터분석기사 실기대비 (R 활용)
섹션 4 작업형 2유형 (16:29) 결과 추가 문의
안녕하세요 선생님, 상세한 강의 잘 듣고 있습니다. 감사합니다. 수강 중, 위의 [섹션4. 2유형] 강의 내용 중 문의사항이 있어 질문을 남깁니다.[동일 내용 문의 링크]맨 마지막 p3에서 2,482명이 나와야 되는거 아닌가요??? - 인프런 | 질문 & 답변 (inflearn.com)문의 커뮤니티 내 동일한 질문이 있어 일부 연장선 문의를 드립니다. (체험) 제2유형 - 체험하기 (goorm.io) - 해당문제model1, model2 을 평균을 내서 최종 모델 p3을 만들고 이를 적용했을 때최근 답변 기준으로 2482개에서 1611개를 제외한 871개의 행이 출력되는 부분은 이해하였습니다.연습 중 제출 형식을 보니, 규정에는 총 2482개의 온전한 데이터 예측 결과를 제출해야 한다고 명시되어 있고이를 강의 상의 871개짜리 데이터로 최종 제출해도 채점 기준에 부합하는지 궁금합니다.저는 TEST 파일은 열 생략이나 결측지 보정 들의 수정이 가해지면 안되는 원본 데이터의 상태로예측 모델을 적용하는 것으로 인지하고 있는데, 해당 부분에 대한 보충 회신을 주시면 감사드리겠습니다. (채점을 위한 기관측의 추가 별도 데이터를 대입하여 예측결과가 실제로 산출되는지 확인하는 부분이 있다하여, 모든 독립변수 행에 대해서도 대응할 수 있는 모델에 대해서 추가 설명이 있으면 도움이 될 것 같습니다.) 제가 강의 내용 중 못 따라간 부분이 있을 수도 있어, 코드 작성 내 놓친 부분이 있는지 계속 수강내용과 확인해 보겠습니다.감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
nunique에 관해 문의 드려요.
작업형 1-3에서 a.nunique().sort_values(ascending=False).index[0] 명령을 보내면,nunique중 첫 번째 문자열과 두 번째 개수 중에 개수로 정렬되는 이유가 궁금하고..index[0]를 하면 문자열만 나오는 이유도 궁금하네요. 저렇게 하면 왜 정렬된 첫번째 열의 이름과 개수가 함께 나오지 않는지..두 명령 모두 문법이 눈에 익지 않네요..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 sklearn이 안불러집니다.
체험 제1유형을 풀려고 했으나, preprocessing 이 안불러집니다. 혹시 시험에서 사용할 수 없는지 궁금합니다.
-
미해결[EduAtoZ] 빅데이터분석기사 실기 (with Python)
시험환경 체험 & 연습사이트의 작업3형 문제풀이
시험환경 체험 & 연습사이트의 작업3형에 대한 문제풀이 요청드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
groupby와 sort
df = df.groupby('month').count() df.sort_values('subscribed').index[0] 선생님 groupby랑 sort의 차이 부탁 드립니다. groupby는 하나의 그룹으로 묶어서 정렬하는 것이고sort는 컬럼별로 정렬할 수 있는 것인가요?ㅠㅠ쓰임새가 어떨 때 쓸 수 있는 건지 궁금합니다. 그리고 구독수의 가장 적은 값을 index[0]로 뽑아주셨는데요~!iloc나 loc로 구할 수는 없을까요? .index[0]은 sort말고 아무데나 붙여도 첫번째 인덱스가 나오는 건가요?ㅠㅠ...
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
4-1 작업형1 모의문제1 numpy질문있습니다
안녕하세요^^ ㅠㅠ 제가 비전공자에 강의를 1번 다 듣고 다시 돌려서 복습하는데도 아직 습득이 느려서 궁금한 사항이 있습니다. 문제 3번 풀이 방법1 replace에서 numpy를 사용하시는데 numpy되도록 거의 안사용하시고 pandas로 풀이해주시는 걸로 알고 있는데 이부분에서는 꼭 사용해야만 하는 이유가 결측값을 찾을 때 어떤 부분에서 사용하는 걸까요? 제가 혼자 풀이할 때 import numpy as np를 사용안하고 그냥 나머지를 동일하게 풀었을 때도 133이 나오긴 하더라구요? ㅠ.ㅠ 잘 모르겟어서 질문드립니다 항상 친절하게 답변해쥬셔서 감사합니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
train과 test unique값이 다를 경우 질문드립니다!!
안녕하세요 선생님 train과 test unique값이 다를 경우에 대해서 궁금한 점이 있어 질문드립니다.df = pd.concat([X_train, X_test]) ddf = pd.get_dummies(df) n = len(X_train) X_train = ddf[:n] X_test = ddf[n:]저번에 선생님께서 다를 경우 이런식으로 합친 다음에 원핫인코딩 해준다고 말씀해주셨는데 만약에 unique값이 너무 많을 경우에는 이런식으로 합친 다음에 레이블 인코딩을 진행해도 될까요?df = pd.concat([X_train.assign(ind = 'train'), X_test.assign(ind = 'test')]) from sklearn.preprocessing import LabelEncoder le = LabelEncoder() df[cols] = df[cols].apply(le.fit_transform) X_train = df[df['ind'] == 'train'].copy() X_train = X_train.drop('ind', axis = 1) X_test = df[df['ind'] == 'test'].copy() X_test = X_test.drop('ind', axis = 1)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 분리할떄
from sklearn.model_selection import train_test_splitX_tr,X_val,y_tr,y_val = train_test_split(X_train,y_train['Reached.on.Time_Y.N'],test_size=0.2,random_state=2021)이거라면 y_train['타켓값']넣고 통째로 외워도 될까요??그리고from sklearn.model_selection import train_test_splitX_tr, X_val, y_tr, y_val = train_test_split(train.drop('TravelInsurance', axis=1), train['TravelInsurance'], test_size=0.1, random_state=1204) X_tr.shape, X_val.shape, y_tr.shape, y_val.shape이건 왜 위에와 다르게 train값에 drop값을 넣는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2
기출유형 4회(작업형2)에서 정답을 보면 데이터 분리 작업을 안하셨는데 그 이유가 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-4 로버스트 스케일링
선생님, 안녕하세요. 로버스트 스케일링이 적용되지 않는 칼럼이 있는 것 같아 문의글 남깁니다.def get_nc_data(): X_train = pd.read_csv("X_train.csv") X_test = pd.read_csv("X_test.csv") y_train = pd.read_csv("y_train.csv") n_train = X_train.select_dtypes(exclude='object').copy() n_test = X_test.select_dtypes(exclude='object').copy() c_train = X_train.select_dtypes(include='object').copy() c_test = X_test.select_dtypes(include='object').copy() return n_train, n_test, c_train, c_testcols = ['age', 'fnlwgt', 'education.num', 'capital.gain', 'capital.loss', 'hours.per.week']from sklearn.preprocessing import RobustScaler n_train, n_test, c_train, c_test = get_nc_data() # 데이터 새로 불러오기 scaler = RobustScaler() display(n_train.head()) n_train[cols] = scaler.fit_transform(n_train[cols]) n_test[cols] = scaler.transform(n_test[cols]) display(n_train.head())이렇게 선생님께서 올려주신 강의노트에서head(2) 부분만 head() 로 수정하여 실행시켜 보았는데요,실행시킨 결과를 보면 capital.gain, capital.loss 두 칼럼에 대해서는 값이 그대로 나옵니다.(민-맥스, 표준화 스케일링에서는 정상 처리된 것으로 확인되었습니다.)제가 놓친 부분이 있는지 확인 가능하실까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
FutureWarning 질문
선생님 안녕하세요. 며칠전에 drop() 함수에서도 동일한 질문을 드렸는데요, 수업을 계속 듣다보니 다른 함수에서도 <ipython-input-25-4fa8e3ad4b16>:5: FutureWarning: The default value of numeric_only in DataFrame.corr is deprecated. In a future version, it will default to False. Select only valid columns or specify the value of numeric_only to silence this warning. X_train.corr() 이런 FutureWarning 메시지가 자주 뜨고 있습니다.(위는 3-2 강의에서 X_train.corr() 코드 실행 시 나타나는 메시지입니다.) 시험을 칠 때도 경고 메시지만 뜨고 오류없이 실행 되는 게 맞을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
케글 스크립트 모드에서 결과보는 방법 문의 드려요.
안녕하세요. 케글에서 스크립트 모드 지정한 다음 결과를 출력하면 스크린샷처럼 한줄만 출력되던데... 혹시 결과를 어디서 보면 되나요?노트북 모드일 때는 아래처럼 노트북에 보이긴 하네요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선쉥님 df[~cond]말고 drop으로 데이터 삭제하는 법 있을까요?
작업형 1 모의고사 2에서 질문 10이하의 이상치 나이를 제거하기 위해서df=df.drop(cond1) 이렇게 하면 안되는 건가요ㅠㅠ...오류가 나더라구요 판린이 이상 질문 드립니다 수업시간엔 아래처럼 사용하셨씁니다!cond1=df['age']<=0df=df[~cond] 이렇게 사용하셧었는데요!! 제가 drop함수만 기억이 나더라구요!!ㅠㅠ 질문 2.df['age'] == round( df['age'], 0) 이 0의자리? 일의자리인가요?? 이 부분을 제가 모르는 것 같은데 설명 부탁 드립니다!! round가 반올림함수라고 알려주셨는데요. 그런데 36.3은 어떻게 거르나 싶더라구요.36.3의 경우에df['age'] == round( df['age'], 0) 이면...소수 첫째짜리에서 정수까지만 나오도록 돼있는데그러면 36.3은 못 거르는 게 아닌가 싶은데 걸러져있더라구용... 이게 어찌된 것인지 설명 부탁 드립니다!! -판린이 드림-
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
test_size
선생님 안녕하세요!데이터분리를 하실때 test_size = random_state=이거 숫자 기준을 어떻게 설정해야하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
sort_values 값 저장
내림차순으로 정렬하고 값을 저장한줄 알았는데 계속 초기 값이 나옵니다ㅠㅠ 이 경우에는 저장이 안되는 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회 기출유형 질문
선생님 2회 기출유형 강의를 듣다가 헷갈리는 부분이 있어서 질문드립니다.df[:10]과 df.iloc[:10]이 어떻게 다른게 헷갈립니다ㅠㅠ 또한 df.iloc[4:7]이면 4부터 6까지 3개의 데이터 값을 가져오는 거이고 df.iloc[:10]이면 0-9까지 총 10개의 데이터의 값을 가져오는 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 1번 질문 드립니다 ㅜㅜ
안녕하세요 선생님 제가 작업형 1 모의문제 1 강의 시청 전에두 가지 방법으로 풀이를 하였는데, 선생님 풀이방법과 조금 다르지만, 답은 완전히 다릅니다 ㅠㅜㅜㅠㅜㅠ혹시 몰라서 로데이터 CSV도 데이터전처리 요청사항대로 해서 풀었는데, 제 풀이 두 가지와 같은 답안인 3077이 나옵니다..(엑셀에서 데이터 전처리 이후 quantile 함수로 추출함) 혹시, 선생님의 풀이와 저의 풀이에 차이점이나 잘못된 점을 알려주 실 수 있을까요? < 1. 첫 번째 풀이 >< 2. 두 번째 풀이 >< 3. 선생님 풀이 >