묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
마인드맵 오타가 있네요:) 수정부탁드립니다,
spicy -> scipycfQ 혹시 마인드맵은 어떤 것으로 만들었는지 여쭤봐도 될까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 8회 2유형 질문
원핫 인코딩시, train 과 test의 컬럼의수가 달라지는 경우가 있어서 데이터를 concat 했다가 다시 분리를 해주고 있는데요. 아래와 같이 코딩시 답안 제출까지는 가능하지만, 강사님께서 풀이한 것과 값차이가 많이 납니다. 이렇게 하면 안되나요?import pandas as pd train = pd.read_csv('churn_train.csv') test = pd.read_csv('churn_test.csv') y=train.pop('TotalCharges') print (train.shape, test.shape, y.shape) total = pd.concat([train, test], axis=0) total=total.drop('customerID',axis=1) # print (total.shape) cols=total.select_dtypes(include = 'object').columns total = pd.get_dummies (total[cols]) train = total[:4116] test = total[4116:] print (train.shape, test.shape, y.shape) from sklearn.model_selection import train_test_split X_train, X_val, y_train, y_val = train_test_split(train, y, test_size=0.2, random_state=0) print(X_train.shape, X_val.shape, y_train.shape, y_val.shape) from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor() rf.fit(X_train, y_train) pred=rf.predict(X_val) pred from sklearn.metrics import mean_absolute_error mae = mean_absolute_error (y_val, pred) print(mae) # 결과값 제출 result = rf.predict(test) # print(result.shape, test.shape) print(result) result = pd.DataFrame ({ 'total price':result }) result.to_csv("result.csv", index=False) print(result) # help(sklearn) # import sklearn # help(sklearn.metrics )
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출유형 > 작업형 1 > 2번째 문제(10:25) 질문입니다.
bmi = df['Weight'] / ((df['Height'] * 0.01) ** 2) normal = (bmi >= 18.5) & (bmi < 23) danger = (bmi >= 23) & (bmi < 25) normal_people = len(df[normal]) danger_people = len(df[danger]) print(abs(normal_people - danger_people)) # 144 위는 제 코드입니다. 결과는 동일한데, bmi의 위험군과 정상체중 구하는 공식에서요, # 강사님 cond1 = (df['bmi'] >= 18.5) & (df['bmi'] < 23) len(df[cond1]) # 제 방식 cond1 = (bmi >= 18.5) & (bmi < 23) len(df[cond1])작성 방법은 모두 다 다르겠지만, 제가 작성하는 방식의 논리가 혹시 나중에 다른 결과값을 가져올 수도 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선형회귀분석에서 표시
범주형변수에 대해 원핫인코딩을 하니 0,1이 바뀌어서 나와요 괜찮은 거죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출 작업형3-2 오즈비 관련
안녕하세요 선생님..! 강의 이해하기 쉽게 가르쳐주셔서 항상 감사드립니다!!다름이 아니라, 8회 기출 작업형 3-2번 오즈비 문제에 대한 해설은 없는건가요?! 제가 어딨는지 못찾아서 질문 드립니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링은 컬럼중 수치형만 뽑아서 따로 해야하나요?
스케일링 : MinMaxScaler, SrandardScaler, RobustScaler스케일링은 컬럼중 수치형만 뽑아서 따로 해야하나요? 아니면 object 있어도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3회 기출 유형 작업형1 문제2
안녕하세요, 강사님3회 기출 유형 작업형1 문제 2번에서df.T를 이용해 푸는 방법에서 'm = df[2000].mean()' 이렇게 작성하였는데,데이터프레임에서 컬럼을 선택할 때는 df['DataFrame'] 형태로 작성해야 한다고 하셔서'm = df['2000'].mean()'으로 작성하니 에러가 발생하였습니다.컬럼명이 숫자일 때는 따옴표를 붙이면 안 되는 것인가요?괄호 안에 따옴표를 붙이는 기준과 안 붙이는 기준이 너무 헷갈리네요 ...ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
exam1 = pd.get_dummies(exam1, columns=['race'], drop_first=True) exam1 = pd.get_dummies(exam1['race'], drop_first=True) 랑 차이가 있나요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 작업형2 라벨인코딩 오류 질문드립니다.
도저히 이해가 안가서,,, 제가 테스트겸으로 하나의 오브젝트 컬럼만으로 라벨 인코딩 테스트를 해보아도 오류가 뜹니다branch컬럼으로 테스트해보았는데요,,,train test 둘다 A B C 가지고 있어서label인코딩이 되야하는데 자꾸만 오류가 뜨네요위는 오류 내용입니다.이게 오류가 발생하는 이유가 무엇인가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험 질문
import pandas as pd df = pd.read_csv이 부분도 시험 때 작성해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
출력 시 FutureWarning
문제를 풀고 sum() 함수를 사용해서 print를 할 때답이 잘 나오긴 하지만 FutureWarning라면서 지속적으로 뜨는 현상이 발생합니다!시험환경에서 답안 제출할 때에 이런 경고문이 떠도 상관이 없는건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Concat 사용 기준
2유형 풀때.concat의 사용 기준이 궁금합니다. 만약 train과 test데이터가 object col이나 숫자형 col이 각각 섞여 있으면 바로 인코딩만 해주면 되지 않나요? 굳이 concat을 해서 나눠야 하는건지 궁금합니더
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
회귀분석에서 ols와 smf 기능에 대해 문의드립니다.
OLS 모델을 적합하는 라이브러리 임포트를 아래와 같이 알고 있는데요.statsmodels.formula. api import ols 선생님께서는 statsmodels.formula. api import smf로 쓰셨는데 동일한 기능인건가요? formula를 만드실 때에도 아래와 같이 쓰셨는데요. model_refit = smf.ols('y ~ x1 + x2 + x3', data=data).fit() ols와 smf 같이 쓰지 않아도 학습이 잘되긴 해서 저는 ols로만 학습시키고 있는데 smf는 어떤 기능이 있는지 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
random state 값
random_state = 0 을 이렇게 고정해주고 있는데 정수값에 따라 성능 지표가 올라갈때도 내려갈때도 있는데 성능 지표가 올라간 정수를 찾아서 고정하는 게 필요한가요?점수에 영향은 하나도 없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다음 상관관계 결과 중 가장 큰 값은 무엇일까요?
상관관계 값이 가장 큰값에 대한 질문입니다.값을 찾을 때 독립변수(x1~x4)만을 비교하여 값을 찾으면 될까요? 아니면 종속변수( y)를 포함하여 가장 큰 값을 찾으면 될까요?처음에는 0.822594 이라고 생각했는데 문제에서 x변수들간의 상관관계를 물어보는 것 같아 -0.224881라 생각하는데...가장 큰 값에 대하여 헷갈리네요^^:
-
해결됨파이썬입문과 크롤링기초 부트캠프 [파이썬, 웹, 데이터 이해 기본까지] (업데이트)
강의 자료 다운 어떻게 받을까요?
안녕하세요~~ 이 강의는 강의 자료가 따로 없는 건가요? 교재라 든가... 등 등강의 자료 다운 받고 싶을때는 어떻게 해야 할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 불러오기
안녕하세요 🙂 궁금한 점이 있어 문의 드립니다.시험 시에 데이터 불러오는 것은 어떻게 하나요?파일에 담겨져 있어서 파일 경로를 가지고 오면 되는 건가요?ㅎㅎ
-
해결됨빅분기 실기! 최신 기출 풀이로 한 방에 합격하기(파이썬)
강의 데이터 관련 안내
안녕하세요. 강의 제공자입니다. 이 강의에서 사용하는 파이썬 프로그램은 구글 콜랩에서 수행을 해야 합니다. 개인 구글 계정이 있으면 되고요. 파이썬 프로그램에서 사용하는 데이터 파일은 프로그램 코드((ipynb 확장자)에서 자동으로 다운로드 받도록 되어 있습니다. 코드를 실행하면서 확인하실 수가 있어요. 가끔 데이터 파일이 없다고 문의를 하시는 분들이 있어서 메세지를 남겨드립니다. 그럼, 참고하시고요. 항상 좋은 일들이 가득하시길 빌겠습니다. 행복한 날들 보내십시오. 감사합니다.
-
해결됨실전! FastAPI 입문
PATCH API - 수정
PATCH API를 통해 todo를 수정하는 코드를 적용하고 실행시켰을 때, 응답의 Response body에 null이 찍힙니다..원인을 찾지 못해 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2유형 예시문제 lightgbm 에러메세지
작업형2유형 예시문제 lightgbm 에러메세지가 계속 뜨네요. 제가 잘못햔거예요 ?