묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형2(신 버전)에서 첫번째방법으로만 풀어도 점수 다 받을수있나요?
강의명 : 예시문제 작업형2(신 버전) 🆕 updated 2023.11 선생님, 해당강의에서 보여주신 2가지 방법 중,1번째 방법으로만 제출해도 점수를 온전히 다 인정받을수있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2번 데이터 분리 과정 질문
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 좋은 강의 감사드립니다.작업형2번에서 데이터를 분리할 때 train, target2.train(타겟드랍), train(타켓)이렇게 train을 그대로 쓸 때와 타겟을 없앤 train을 쓸 때의 차이가 헷갈립니다. 그리고 타겟으로 뺄 때외 안뺄때는 편의 차이인지 이유가 있는지 궁금합니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형3 C() 질문 드립니다.
안녕하세요~ 작업형3 C() 관련해서 이렇게 이해하면 될까요? 범주형 값일 때, 경우1. ols(회귀), logit(로지스틱회귀)문자형 → 자동 처리수치형 → C() 경우2. 분산분석독립변수 == 범주형 변수 → 숫자만 C()로 묶어도 되고, 독립 변수 모두를 각각 C()로 묶어도 됨 항상 좋은 강의 감사합니다!😊
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2회차 작업형 1 문제 3 질문드립니다.
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요cond1 = df['age'].mean() + df['age'].std() * 1.5 cond2 = df['age'].mean() - df['age'].std() * 1.5 out1 = df['age'] > cond1 out2 = df['age'] < cond2 print(df['age'][out1 | out2].sum())print(df[(cond1)|(cond2)]['age'].sum())아래 코딩처럼 cond1 ,cond2 를 괄호로 묶으신 이유가 있을까요?? 위 방법처럼 묶지 않았을 때 같은 정답 나왔습니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 질문입니다.
뭔가 알면 알수록 계속 욕심이 생깁니다..(시험 때 어떻게든 score를 높이기 위해..)총구매액, 최대구매액, 환불금액 같은 경우는 숫자가 너무나도 크기 때문에, StandardScaler를 쓰면 좋을 것 같아 보입니다. StandardScaler는 그 해당 컬럼 값의 max값과 min값이 1000이상 차이나면 사용하면 좋을까요?어떤 경우에 쓰면 좋을지 방향성을 알고 싶습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
numeric_only=True는 실제 시험에서 작성해야하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요판다스에서 .corr사용했을 때 오류가 떠서 numeric_only=True같이 입력했는데 시험때도 써야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제1 질문
앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 아래와 같이 풀이했는데, 코드가 실행되지 않는 이유가 궁금합니다.df = df[:int(len(df) * 0.7)] cond3 = df['views'].quantile(0.75) - df['views'].quantile(0.25) df[cond3]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링
왜 모의고사 문제들은 범주형 데이터를 라벨링만하고수치형 데이터들은 스케일링 진행을 따로 하지않았나요???크게 상관없이 없는건가요? (꼭 할 필요없나요?)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 작업형 2 질문!
여유 없으면 랜덤포레스트 모델 하나만 해도 크게 지장없는 걸로 알고 있습니다. 근데 모델 구성 중에 max_depth 이나 random_state에 따라 점수가 차이가 날 수 있는 건 당연한데,이 차이가 많이 날 수 있나요...? 저번 시험에서 max_depth 설정한 사람과 안한 사람 차이 점수가 10점 이상 난 걸로 알고 있어서...ㅠ그리고 예를들어 모델 검증으로 max_depth=7이 max_depth=5가 더 좋은 평가지표가 나왔는데,실제 test랑 비교했을 때 max_depth=5가 더 좋을 수 있는 것 아닌가요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 놀이터 캐글
T1-21 문제 풀어보고 있는데요, 캐글에서 올려주신 코드로 작성한 결과와 제가 작성한 코드의 결과가 달라 질문 드립니다. (*제가 작성한 전체 코드는 맨 아래에 있습니다.) 바로 아래 코드에 대한 출력값은 90, 30, 30, 30 입니다. (답은 167.0 으로 출력됩니다.) 이를 통해 이상값 처리와 데이터 분할 모두 옳게 했다고 볼 수 있는데, 답은 165가 아닌 167이 나와서 도대체 어디서 잘못된건지 모르겠습니다. 답변 주시면 감사하겠습니다!# print(len(df['age'])) # print(len(df['age'].iloc[:30])) # print(len(df['age'].iloc[30:60])) # print(len(df['age'].iloc[60:90]))import pandas as pd import numpy as np df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv') # print(df.head()) # print(df.info()) cond1 = df['age'] > 0 cond2 = df['age'] == round(df['age'], 0) df = df[cond1 & cond2] # print(df.head()) # print(len(df['age'])) # print(len(df['age'].iloc[:30])) # print(len(df['age'].iloc[30:60])) # print(len(df['age'].iloc[60:90])) median1 = df['age'].iloc[:30].median() median2 = df['age'].iloc[30:60].median() median3 = df['age'].iloc[60:90].median() print(median1+median2+median3)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 궁금증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 작업형 2 한 가지 방법으로 풀기를 봤는데요지금까지는 결측치나 이상치가 없었던 것으로 알고있는데요1.만약 8회차에 결측치나 이상치가 존재한다면 여기서 EDA이후 결측치나 이상치를 제거하고 인코딩으로 넘어가면 되는거죠??2.그리고 영상에서는 target빼고 원핫 인코딩으로 다 진행 하던데 혹시나 조금 더 꼼꼼하게 진행할려면 target데이터 제외후 범주형은 원핫 인코딩 수치형은 스케일링 돌린후 검증 데이터 나누고 randforest로 학습 및 평가 후 제출 하면 되는 걸 까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-23 추가질문
캐글에 올려주신 자료 중 T1-23 문제를 다시 풀어보고 있는데 선생님 답과 다른 답이 나와서 질문 드립니다.선생님 풀이와 다른 부분은 10번째 값을 찾는 부분만 다른 코드로 했는데요10번째 값은 88으로 같은데 중복값 제거 후 f1 중앙값이 75로 선생님 풀이의 값 77과는 다르게 나옵니다.이유가 뭔지 알 수 있을까요? # f1 결측치를 f1을 내림차순으로 소팅했을 때 10번째 인덱스에 위치한 값으로 채움df=df.sort_values('f1', ascending=False)df=df.reset_index()# print(df.head(10))a=df.loc[9,'f1']print(a)# print(df.isnull().sum())df['f1']=df['f1'].fillna(a)# print(df.isnull().sum())# age컬럼의 중복 제거 전 f1중앙값m1=df['f1'].median()print(m1)# age컬럼의 중복 제거 후 f1중앙값print(df.shape)df=df.drop_duplicates(subset=['age'])print(df.shape)m2=df['f1'].median()print(m2)print(abs(m1-m2))
-
미해결(2025) 일주일만에 합격하는 정보처리기사 실기
조건문 강의 예시문제 질문있습니다.
조건문 강의 5:46초 에 나오는 조건문 예시문제에서출력값이 5보다 크네요 라고 하셨는데5보다 크지 않아요 가 맞지 않나요 ?number = 3 3 > 5 니깐 else 문이 출력될 것 같습니다
-
미해결(2025) 일주일만에 합격하는 정보처리기사 실기
강의 내용에 기출문제도 포함되어 있나요 ?
안녕하세요. 강의 잘 듣고 있습니다.아직 다 듣지 않았지만 궁금한 사항이 있어서 여쭤봅니다. 현재 올라와있는 동영상 강의는 완성본인가요, 아니면 계속 업데이트 될 예정인가요 ?강의 내용에 기출문제도 포함되어 있나요 ?PDF 파일은 어디에 있을까요 ?감사합니다.
-
미해결파이썬 무료 강의 (기본편) - 6시간 뒤면 나도 개발자
설치완료 후 Extensions에서 python 검색 시 에러 나요
Extensions에 들어가서 Python 검색하면 아래 에러 때문인지검색이 안되요 "Error while fetching extensions, XHR failed"
-
미해결[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
확장자에 따라 다른가요?
혹시 .py & .ipynb 확장자에 따라 코드가 잘 실행되고 안되고 그럴 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션11 작업형1 문제 1번
상위 10번째 값으로 대체하는 부분에서 df.iloc[:10,-1] = min_value 이렇게 하셨는데 df['views'].iloc[:10]= min_value 이렇게 풀어도 상관없을까요? 만약 2번째 풀이도 상관 없다면 첫번째 풀이로 진행하신 이유가 있을까요? 취향차이일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정규성을 만족하지 않은 가설검정 (단일표본, 대응표본)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요정규성을 만족하지 않을 때 단일 표본과 대응 표본에서 윌콕슨을 사용하려고 합니다. 이때 단일 표본 stats.wilcoxon(df['관측치명']-평균값, alternative=) 라 했을 때차이로(df['관측치명']-평균값) 계산하였고대응표본은 차이로 계산이 가능하지만, 더 쉬운 방법인 df['before'], df['after'], alternative= 를 사용하였습니다. 그렇다면 단일표본에서도 df['관측치명'], 평균값으로 계산해서 될까요?만일 안된다면, 윌콕슨은 차이 값를 기반으로 검정 통계량을 계산하는 것인데 대응표본은 두가지로 가능하면서 단일표본은 무조건 왜 -(차이)를 사용해야 하는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류가뜹니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 작업형 1-10 여-존슨과 박스-칵스 변환
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이 부분에서 standarlize=False를 하는 이유가 궁금합니다.