묻고 답해요
143만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
numeric_only=True는 실제 시험에서 작성해야하나요?
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요판다스에서 .corr사용했을 때 오류가 떠서 numeric_only=True같이 입력했는데 시험때도 써야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형1 모의문제1 문제1 질문
앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 아래와 같이 풀이했는데, 코드가 실행되지 않는 이유가 궁금합니다.df = df[:int(len(df) * 0.7)] cond3 = df['views'].quantile(0.75) - df['views'].quantile(0.25) df[cond3]
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
스케일링
왜 모의고사 문제들은 범주형 데이터를 라벨링만하고수치형 데이터들은 스케일링 진행을 따로 하지않았나요???크게 상관없이 없는건가요? (꼭 할 필요없나요?)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 작업형 2 질문!
여유 없으면 랜덤포레스트 모델 하나만 해도 크게 지장없는 걸로 알고 있습니다. 근데 모델 구성 중에 max_depth 이나 random_state에 따라 점수가 차이가 날 수 있는 건 당연한데,이 차이가 많이 날 수 있나요...? 저번 시험에서 max_depth 설정한 사람과 안한 사람 차이 점수가 10점 이상 난 걸로 알고 있어서...ㅠ그리고 예를들어 모델 검증으로 max_depth=7이 max_depth=5가 더 좋은 평가지표가 나왔는데,실제 test랑 비교했을 때 max_depth=5가 더 좋을 수 있는 것 아닌가요...?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 놀이터 캐글
T1-21 문제 풀어보고 있는데요, 캐글에서 올려주신 코드로 작성한 결과와 제가 작성한 코드의 결과가 달라 질문 드립니다. (*제가 작성한 전체 코드는 맨 아래에 있습니다.) 바로 아래 코드에 대한 출력값은 90, 30, 30, 30 입니다. (답은 167.0 으로 출력됩니다.) 이를 통해 이상값 처리와 데이터 분할 모두 옳게 했다고 볼 수 있는데, 답은 165가 아닌 167이 나와서 도대체 어디서 잘못된건지 모르겠습니다. 답변 주시면 감사하겠습니다!# print(len(df['age'])) # print(len(df['age'].iloc[:30])) # print(len(df['age'].iloc[30:60])) # print(len(df['age'].iloc[60:90]))import pandas as pd import numpy as np df = pd.read_csv('../input/bigdatacertificationkr/basic1.csv') # print(df.head()) # print(df.info()) cond1 = df['age'] > 0 cond2 = df['age'] == round(df['age'], 0) df = df[cond1 & cond2] # print(df.head()) # print(len(df['age'])) # print(len(df['age'].iloc[:30])) # print(len(df['age'].iloc[30:60])) # print(len(df['age'].iloc[60:90])) median1 = df['age'].iloc[:30].median() median2 = df['age'].iloc[30:60].median() median3 = df['age'].iloc[60:90].median() print(median1+median2+median3)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2 궁금증
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요안녕하세요 작업형 2 한 가지 방법으로 풀기를 봤는데요지금까지는 결측치나 이상치가 없었던 것으로 알고있는데요1.만약 8회차에 결측치나 이상치가 존재한다면 여기서 EDA이후 결측치나 이상치를 제거하고 인코딩으로 넘어가면 되는거죠??2.그리고 영상에서는 target빼고 원핫 인코딩으로 다 진행 하던데 혹시나 조금 더 꼼꼼하게 진행할려면 target데이터 제외후 범주형은 원핫 인코딩 수치형은 스케일링 돌린후 검증 데이터 나누고 randforest로 학습 및 평가 후 제출 하면 되는 걸 까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 T1-23 추가질문
캐글에 올려주신 자료 중 T1-23 문제를 다시 풀어보고 있는데 선생님 답과 다른 답이 나와서 질문 드립니다.선생님 풀이와 다른 부분은 10번째 값을 찾는 부분만 다른 코드로 했는데요10번째 값은 88으로 같은데 중복값 제거 후 f1 중앙값이 75로 선생님 풀이의 값 77과는 다르게 나옵니다.이유가 뭔지 알 수 있을까요? # f1 결측치를 f1을 내림차순으로 소팅했을 때 10번째 인덱스에 위치한 값으로 채움df=df.sort_values('f1', ascending=False)df=df.reset_index()# print(df.head(10))a=df.loc[9,'f1']print(a)# print(df.isnull().sum())df['f1']=df['f1'].fillna(a)# print(df.isnull().sum())# age컬럼의 중복 제거 전 f1중앙값m1=df['f1'].median()print(m1)# age컬럼의 중복 제거 후 f1중앙값print(df.shape)df=df.drop_duplicates(subset=['age'])print(df.shape)m2=df['f1'].median()print(m2)print(abs(m1-m2))
-
미해결(2025) 일주일만에 합격하는 정보처리기사 실기
조건문 강의 예시문제 질문있습니다.
조건문 강의 5:46초 에 나오는 조건문 예시문제에서출력값이 5보다 크네요 라고 하셨는데5보다 크지 않아요 가 맞지 않나요 ?number = 3 3 > 5 니깐 else 문이 출력될 것 같습니다
-
미해결(2025) 일주일만에 합격하는 정보처리기사 실기
강의 내용에 기출문제도 포함되어 있나요 ?
안녕하세요. 강의 잘 듣고 있습니다.아직 다 듣지 않았지만 궁금한 사항이 있어서 여쭤봅니다. 현재 올라와있는 동영상 강의는 완성본인가요, 아니면 계속 업데이트 될 예정인가요 ?강의 내용에 기출문제도 포함되어 있나요 ?PDF 파일은 어디에 있을까요 ?감사합니다.
-
미해결파이썬 무료 강의 (기본편) - 6시간 뒤면 나도 개발자
설치완료 후 Extensions에서 python 검색 시 에러 나요
Extensions에 들어가서 Python 검색하면 아래 에러 때문인지검색이 안되요 "Error while fetching extensions, XHR failed"
-
미해결[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
확장자에 따라 다른가요?
혹시 .py & .ipynb 확장자에 따라 코드가 잘 실행되고 안되고 그럴 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
섹션11 작업형1 문제 1번
상위 10번째 값으로 대체하는 부분에서 df.iloc[:10,-1] = min_value 이렇게 하셨는데 df['views'].iloc[:10]= min_value 이렇게 풀어도 상관없을까요? 만약 2번째 풀이도 상관 없다면 첫번째 풀이로 진행하신 이유가 있을까요? 취향차이일까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
정규성을 만족하지 않은 가설검정 (단일표본, 대응표본)
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요정규성을 만족하지 않을 때 단일 표본과 대응 표본에서 윌콕슨을 사용하려고 합니다. 이때 단일 표본 stats.wilcoxon(df['관측치명']-평균값, alternative=) 라 했을 때차이로(df['관측치명']-평균값) 계산하였고대응표본은 차이로 계산이 가능하지만, 더 쉬운 방법인 df['before'], df['after'], alternative= 를 사용하였습니다. 그렇다면 단일표본에서도 df['관측치명'], 평균값으로 계산해서 될까요?만일 안된다면, 윌콕슨은 차이 값를 기반으로 검정 통계량을 계산하는 것인데 대응표본은 두가지로 가능하면서 단일표본은 무조건 왜 -(차이)를 사용해야 하는지 궁금합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
오류가뜹니다!
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 작업형 1-10 여-존슨과 박스-칵스 변환
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요이 부분에서 standarlize=False를 하는 이유가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
count질문
sum은 false를 0으로 처리해서 연산에 포함시키지 않는데, count의 경우 false도 카운트가 되나요?
-
미해결[2024 개정판] 이것이 진짜 크롤링이다 - 실전편 (인공지능 수익화)
pip install pyperclip 에러
안녕하세요. pip install pyperclip 를 주피터노트북에 따라하니까 다음 에러가 발생합니다.-----------------Cell In[1], line 1 pip install pyperclip ^ SyntaxError: invalid syntax ------------------그래서, 찾아보니까 !pip install pyperclip 로하면된다고 하여 설치는 했는데, 이번에는 다음과 같이 import pyperclip에서 에러가 발생합니다. 도움 부탁드립니다.현재 주피터 노트북에서 python 버전은 3.12.3 입니다.------------ModuleNotFoundError Traceback (most recent call last)Cell In[1], line 6 4 from selenium.webdriver.common.keys import Keys 5 import time----> 6 import pyperclip 9 #크롬 드라이브 생성 10 driver=webdriver.Chrome()ModuleNotFoundError: No module named 'pyperclip'"
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 2유형 예시문제 제출형식
제출형식 예시는 0,1 값으로 표시되어 있는데요. 평가지표는 roc_auc 입니다.pred_proba로 roc_auc를 산출하는것은 알겠으나 제출형식이 정수형으로 주어졌는데. 저희는 제출할때 확률값으로 제출해도 되는지요? 아니면 0.5 보다크면 1 작으면 0 으로 변환해서 제출해야 하는건가요? 실제 시험에서 확률값으로 제출하면 감점될것 같아서 평가방식에 중점을 둬서 제출해야하는지 어떤게 맞는건지 잘 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출 5회 작업 101
학습 관련 질문을이거 결과가 다르게 나오는데 왜 그런건가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형 자주 사용되는 함수나 문장
수업을 들으면서 1유형 같은 경우에 자주 나오는 함수나 문장 같은게 많은데 혹시 실례가 되지 않는다면 한번 마인드맵 때처럼 프린트해서 볼 수 있게 정리해주실 수 있을까요? 항상 강의와 답변 감사드립니다!