묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-1 작업형2 모의문제1 강의 내용 질문
안녕하세요. 선생님해당 강의에서피처엔지니어링을 위해 베이스 라인(수치형 데이터만 사용해보기) 만드는 과정에서선생님께서는cols = train.select_dtypes(include="O").columnstrain = train.drop(cols, axis=1)test= test.drop(cols, axis=1)로 하셨는데요. train = train.select_dtypes(exclude="O")test = test.select_dtypes(exclude="O") 로 해도 문제 없을까요? drop() 메소드로 cols 변수에 넣은 칼럼을 axis=1 로 전부 제거한거니까그냥 범주형 데이터를 제외 시키는 select_dtypes(exclude="O") 으로 해도 문제 없을 것 같긴 한데, 확인차 질문 글 남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
df.drop 사용시 에러 발생
선생님, df.drop("시즌", axis = 0) 으로 작성하면 에러가 안뜨지만df.drop("시즌", 0) 으로 작성하면 다음과 같은 에러메세지가 뜹니다.이유를 알 수 있을까요?|DataFrame.drop() takes from 1 to 2 positional arguments but 3 were given
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
주어진 csv파일이 2개일때와 3개일때 차이가 궁금합니다
csv 파일이 주어질때 train, test 2개 주어질때와X_train , y_train, X_test 3개 주어질때간단하게 생각하면 X_train,y_train 데이터로 나눠있는 데이터를 train으로 나누지 않고 주어졌다고 생각하면 될가요? 2개로 주어졌을때는 타겟값만 pop으로 빼내고3개일때는 train값을 합쳐서 결측치, 전처리 하면 될가요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-1 7회 기출 유형(작업형1) 문제 2번에서
시험장에서 아래와 같이 풀이해도 괜찮을까요?loc를 사용하지 않고 df["DE14"]를 입력해서 구해도 괜찮은지 궁금합니다! # DE1~DE77컬럼 중 주가지수의 종가 "close"와 가장 상관관계가 높은 변수를 찾아 abs(df.corr()["close"]).sort_values(ascending = False) # 해당 변수의 평균값을 구하시오. (반올림하여 소수 넷째자리까지 계산) print(round(df["DE14"].mean(),4))
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링 질문드립니다
안녕하세요 강사님강의 풀이 중 궁금한게 있어서 질문드립니다! 강의에서 object 타입의 대해서만 encoder 하고,int, float 타입에 대해서는 별도의 scaler 작업을 안하신 것 같은데 혹시 스케일링 작업은 필수가 아닌가요?? 성능만 잘 나오면 생략해도 무방한가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션 16-3 7회 기출 유형 작업형3 문제1-2에서 glm 대신 logit을 사용해도 되나요?
glm 대신 logit을 사용해도 되나요? 아래와 같이 입력하면 model. summary 결과에 deviance 값이 없는데, 문제에서 로지스틱 회귀 모델을 적합시키라고 했는데 어떨때는 logit을 사용하고, 어떨때는 glm을 사용해야 하는지 모르겠습니다!from statsmodels.formula.api import logit model = logit("gender ~ age + length + diameter + height + weight", data = train).fit() model.summary()
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 모의문제2 : R2 SCORE / ID 삭제
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 안녕하세요~작업형2 모의문제2 : 에어비엔비 가격예측에서 2가지 질문드립니다. 작업형2 모의문제1에서는 CLIENTNUM로 인해서 과대적합 가능성이 있다고했는데 이번에는 id는 남겨놓고 host,name 등만 삭제하셨더라구요. 이번엔 ID를 남겨놓은 이유가 있을까요? R2 score 값이 1에 가까울수록 좋은 모델이라고 알고 있었습니다. 질문을 찾아보니 모델 점수에 연연하지 말라고 하셨는데, 그래도 R2 SCORE값이 -값이 나오거나 0.01 정도로 나오면 시험볼 때 많이 불안할 것 같더라구요.. - 값이나 0.01 정도로 나와도 괜찮은 건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글- 작업형3 updated 2023.11에서 독립성 검정 문제
Chi2ContingencyResult(statistic=5.929494712103407, pvalue=0.01488951060599475, dof=1, expected_freq=array([[115., 115.], [185., 185.]]))다음과 같이 결과가 나오는데, 여기서 expected_freq=array(남자의 합격 기대빈도(115), 남자의 불합격 기대빈도(115), 여자의 합격 기대빈도(185), 여자의 불합격 기대빈도(185))이 순서가 맞나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
대응표본검정 강의 6:35초 문의
안녕하세요! 대응표본검정 강의 6:35초 부분에서윌콕슨 검정 alternative를 대립가설 기준으로 봐야한다고 말씀하신 이유가,샤피로-윌크 검정에서 대립가설을 따른다고 결론이 났기 때문인가요? 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요작업형 2 모의문제 1에서 랜덤포레스트 후 실행하는 데 자꾸 저런 오류가 뜹니다. 어떻게 해야 하나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
노트북&데이터 자료 일괄 다운로드 방법 문의
안녕하세요 🙂 수업자료 ipynb와 data파일을 일괄적으로 다운받을 수 있는 방법이 있을까요? 확인 부탁드립니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
선언문에 대한 질문
수업을 듣다보면 함수나 모델이나 이런것들을 가져올때 nump, sklearn, sklearn.preprocessing 등...그리고 import 해오는 것들이 어디에 속해있는 것인지? 이런 것들이 외우려니 좀 많이 혼동이 되서 잘 안외어져서 질문드립니다. 시험장에서 좀더 효율적으로 잘 기억나게 하는 방법이 있는지요?아니면 나올때 마다 다 외워야하는지요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
컬럼 선택
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요 둘 중 어느방법을 써도 무방할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
검증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요실제 시험장에서 검증단계가 꼭 필요한가요?
-
해결됨파이썬을 활용한 머신러닝 딥러닝 입문
주피터에서 파일 열기
강의 자료 주피터 안에서 어떻게 여나요?정말 초보라서 잘 모릅니다ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회 작업형 3유형 카이제곱 검정 List 값 문의
ob = df.value_counts(normalize=True).sort_index() ob = ob.to_list() ex = [0.1, 0.05, 0.15, 0.7]즉, 관찰값과 기댓값을 비율로 입력하여관찰값 [0.2, 0.15, 0.1, 0.55]기댓값 [0.1, 0.05, 0.15, 0.7] 으로 비교하면 안되나요?비율은 같은데 통계량과 P-value 가 다르게 나오네요.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
원핫인코딩
원핫인코딩 하니 0,1이 아닌 True, False로 결과가 나왔습니다.수치결과가 다르지는 않았어서 큰 문제는 아닌것같은데, 0,1,로 나타낼 방법은 없을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
LinearRegression, LogisticRegression 쓸 때
/usr/local/lib/python3.10/dist-packages/sklearn/linear_model/_logistic.py:458: ConvergenceWarning: lbfgs failed to converge (status=1): STOP: TOTAL NO. of ITERATIONS REACHED LIMIT. Increase the number of iterations (max_iter) or scale the data as shown in: https://scikit-learn.org/stable/modules/preprocessing.html Please also refer to the documentation for alternative solver options: https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression n_iter_i = checkoptimize_result( 계속 이 문구가 뜨는데, 문제가 있는 걸까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
질문이 있습니다~~
기출2회를 풀고 있는데요주어진 데이터셋(members.csv)의 앞에서부터 순서대로 80% 데이터만 활용해 'f1'컬럼 결측치를 중앙값으로 채우기 전 후의 표준편차를 구하고, 두 표준편차 차이 계산하기 (단, 표본표준편차 기준, 두 표준편차 차이는 절대값으로 계산) 이 문제를 시험환경에서 풀면len(df)*0.8 df = df.iloc[:80] df before = df['f1'].std() median1 = df['f1'].median() # 20.574853076621935 import numpy as np df['f1'] = df['f1'].fillna(median1) after = df['f1'].std() # 17.010788646613268 이게 한 창 안에서 한번에 코딩이 되면서before과 after 둘다에 17.010 어쩌고가 들어가서print(before-after) 을 하면 0이 되더라고요 실행은 한 코딩창 안에서 진행해야 하는데그럼 숫자를 따로 저장해서 20.574 - 17.010 을 출력해야 하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2 유형 평가 방식
안녕하세요첫 실기 준비이다 보니 궁금한게 너무 많네요 ㅠㅠ 2유형 평가는 순수하게 제출된 csv 파일로만 평가되나요?아니면 풀이한 코드까지 평가 대상인가요?