묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
6회기출 작업형 3유형 문제질문
2. 데이터에서 'solar'와 03' 값을 고정한 상태에서, 'wind'의 세기가 증가함에 따라 'temperature'가 감소하는지를 검증하기 위해 다중 선형 회귀 분석을 수행하고, 'wind'의 회귀 계수에 대한 p-value 값을 구하시오. (유의수준: 0.05) 위의 문제를 보면 wind의 회귀계수에 대한 p-value 를 구하고 답안으로 제출되는데. 앞에 나열된 전제조건은 "데이터에서 'solar'와 03' 값을 고정한 상태에서, 'wind'의 세기가 증가함에 따라 'temperature'가 감소하는지를 검증" 은 별다른 작업이 이루어 지지 않아서 이해가 잘 되지 않아서 질문드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글필사전략 강의의 18:29 에 보이는 예상문제들과 주소는 어디가야 볼수있나요?
캐글필사전략 강의의 18:29 에 보이는 예상문제들과 주소는 어디가야 볼수있나요?(캐글에 Dataset->code 에는 18:29에서 보이는 화면과 다르게 정렬이 안되있는것 같아서요)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝에서 의사결정나무와 XGBOOST를 무시하고 랜덤포레스트만 돌리고 제출할려고 하는데 에러가 납니다.
제목 그대로 랜포만 돌리고 제출할려고 하는데 array length 2931 does not match index length 3257 에러 메세지가 뜹니다. 코딩의 어느 부분이 잘못되었는지 감을 못잡겠습니다.알려주시면 감사하겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2 유형 질문 드립니다
안녕하세요!2유형에서 궁금한 점이 있어 추가 질문드립니다. age 컬럼 같은 경우 음수, 소숫점 등과 같이 명확한 이상치가 보일 경우 결측치를 채우기 전 이상치를 먼저 처리하는게 나을까요? 결측치를 평균 혹은 중앙 값으로 채운다고 가정 했을 때, 이상 값이 있으면 성능에 영향을 주지 않을까 싶어서 질문드립니다 만약 이상치가 많이 존재하고 이를 처리한다고 하면,이상치 행을 아예 삭제해야하나요?아니면 결측치와 마찬가지로 이상치를 제외한 평균, 중앙 값을 계산해서 값을 변경해주는게 좋을까요? 오늘도 감사합니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
코랩에서 사용가능한 RAM 초과로 셀 실행이 안되는경우..
코랩에서 사용가능한 RAM 초과로 셀 실행이 안되는경우..어떻게 해야할까요...? 모델 돌리는데 계속 런아웃 오류납니다..
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출유형 (작업형1) csv 파일을 어디에서 확인할 수 있나요??
5회 기출유형 (작업형1) csv 파일을 어디에서 확인할 수 있나요??캐글에 작업형2 csv 파일만 보입니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
min-max scaler 혹은 standard scaler 가 효과적인 경우
수치형 변수 스케일링할 때 min-max scaler가 더 효과적인 경우,standard scaler가 더 효과적인 경우 좀 구분할 수 있을까요 ?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3(신버전) 로지스틱회귀 강의 질문입니다.
(체험) 제 3유형 (풀이용) 1번 문제에서 질문입니다. "개수를 세어서 크로스탭으로 만드는 함수가 있다"라고 말하시고 pd.crosstab 함수를 사용하시고, chi2_contingency 함수에 넣어서 카이제곱 통계량을 산출하셨습니다. 여기서 왜 크로스탭으로 만들어야하는지 이해가 안되서 질문을 드립니다. 카이제곱 통계량 계산시 chi2_contingency 함수에 입력 파라미터로 무조건 크로스탭 함수를 만들어서 넣어야 하기 때문인가요? 이해가 안가서 글남깁니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
샘플데이터 주소복사...
선생님, input 에서 저렇게 저는 안되던데 ...다른 설정을 해야할까요? 화면도 실제랑 강의랑 좀 달라서 어려움이 있습니다 ㅠㅠ 확인 부탁드립니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
노션 주소 공유가 될까요?
선생님 안녕하세요, 강의 보니까 노션에 정리 해 두셨던데 노션 제 페이지에 저도 저렇게 정리 하려고 하는데 , 혹시 노션링크 받을 수 있을까요? 예전에 보니 본인 페이지를 공유 할수도 있더라고요 ㅎㅎ 캐글 매번 들어와야 하는 번거로움을 줄일 수 있지 않을까 해서 여쭤봅니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
[질문사항]데이터 핸들링을 위한 판다스 기초1
안녕하세요 파이썬을 처음 배우고 있는데 데이터 프레임을 생성한 후 type을 확인하는 과정에서 다음과 같은 메시지가 뜨는데 왜뜨는지 이유를 모르겠습니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
복습
선생님 !우선 강의 잘 듣고있습니다.많이 배워지는거 같아요~혹시 수업 듣기전 먼저 문제 풀어보고 수업 들으면서 타이핑은 하고 있는데 한강 듣고 난 후 빈칸 코랩시트지 다시 다운받아서 첨부터 혼자서 타이핑 해보고 다음강으로 넘어가는게 좋을까요? 아님 우선 먼저 빨리 1회독 하는게 좋을까요?제안해주신대로 암기는 일단 차치하고 나아갈 생각입니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
캐글 [py] T1-1. 문제에서 답이 다르게 나옵니다
코랩에서 [py] T1-1. 이상치를 찾아라(IQR활용) Expected Questions 문제입니다아래 풀이로 진행했을 때 정답이 다르게 나오는데 혹시 어느 부분에서 차이가 발생한건지 알 수 있을까요?? import pandas as pd df = pd.read_csv("train.csv") # df.info() # df.head() # df.isnull().sum() # IQR을 활용해 Fare컬럼의 이상치를 찾고, # outlier1 = 1q - 1.5 * iqr # outlier2 = 3q + 1.5 * iqr # iqr = 3q - 1q q1 = df["Fare"].quantile(.25) q3 = df["Fare"].quantile(.25) iqr = q3 - q1 # outlier1 = df["Fare"] < (q1 - 1.5 * iqr) # outlier2 = df["Fare"] > (q3 + 1.5 * iqr) q1 - 1.5 * iqr, q3 + 1.5 * iqr outlier1 = df[df["Fare"] < (q1 - 1.5 * iqr)] outlier2 = df[df["Fare"] > (q3 + 1.5 * iqr)] # # 이상치 데이터의 여성 수를 구하시오 len(outlier1["Sex"] == "female") + len(outlier2["Sex"] == "female")
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
모의문제 3 - 8번 문제 질문드립니다.
8번 문제 복습 중 궁금증이 생겨서 질문드립니다.1) cond = df.loc[2001] > m2001r1 = sum(cond)cond = df.loc[2003] < m2003r2 = sum(cond)print (r1+r2) 2) r1 = df.loc[2001] > m2001r2 = df.loc[2003] < m2003print (sum(r1+r2))1) 같은 경우는 정답 풀이를 그대로 가져와서 출력 값이 202이고,2) 같은 경우는 제가 다른 방법으로 풀어볼 수 있을까 하는 궁금증에서 적어봤습니다. 출력 값은 202가 아닌 150이 나왔습니다. 둘 다 같은 풀이법 같지만 출력 값이 다른 이유가 궁금해서 질문드립니다 !
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
기출유형 4회(작업형1)
(문제)date_added가 2018년 1월 이면서 country가 United Kingdom 단독 제작인 데이터의 갯수(풀이4)# 풀이4 import pandas as pd df = pd.read_csv("nf.csv") cond1 = df['country'] == "United Kingdom" df['date_added'] = df['date_added'].fillna("") str1 = "2018" str2 = "January" cond2 = df['date_added'].str.contains(str1) cond3 = df['date_added'].str.contains(str2) print(len(df[cond1 & cond2 & cond3]))이 풀이에서 df['date_added'] = df['date_added'].fillna("")중간에 fillna를 사용한 이유는 무었인가요?빼고 해도 답은 같아서요.다른 필요한 상황이 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험응시전략 🆕 updated 2023.11 노션 자료는 어디에서 확인할 수 있나요??
시험응시전략 🆕 updated 2023.11 노션 자료는 어디에서 확인할 수 있나요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
자주 활용되는 판다스 예제 quiz 3
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요quiz 3 데이터 수를 구할 때선생님께서 알려주신 len(df[cond]) 외에df[cond].shape[0] 이나 df[cond].count()[0]을 사용해도 괜찮나요??값은 동일하게 나옵니다!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
2유형 질문드립니다!
안녕하세요!2유형 강의 수강 중 궁금한 점이 생겨서 질문드립니다! IQR 을 사용하여 이상치를 확인 했을 때, 이상치가 전체 행 대비 적게 있을 경우 해당 행 자체를 삭제해도 무방한가요? 스케일링 시, 이상치가 있을 경우 로버스트 스케일링을 사용하는게 좋다라고 하셨는데 이상치가 있는 컬럼에 대해서만 로버스트 스케일링으로 진행하고, 이상치가 없는 컬럼에 대해서는 MinMax 이나 Z-Score 를 사용하여 구분해서 각각 스케일링 하는게 좋은가요? 2-2. 만약 이상치가 없는 경우에도 로버스트 스케일링을 사용할 경우 다른 스케일링 방식에 비해 성능이 떨어지나요? 감사합니다~!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
공부법 질문
퇴근 후 매일 강의를 조금씩 듣고 있습니다.이제서야 작업형 1 강의 목차로 들어왔는데요!저는 강의 들으면서 pause 누르고 타이핑 해보고 저만의 암기노트를 만들면서 시간 있을 때 외우고 있습니다.지금부터 조금씩 외우는 이유는 지금 시간 들여서 강의를 들었는데 쭉쭉 넘어가다보면 (물론 타이핑은 겸하면서) 나중에 또 보면 새로울거 같아서 기억이 있을 때 까먹더라도 외우려고 하고 있긴합니다.다만, 암기를 하니 좀 속도가 더디긴 하네요 ㅠㅠ지금은 암기하지말고 한번 쭉 따라하면서 듣는게 낫나요?저는 문제 풀 때 암기가 되어있지 않으면 안풀리는데 이것은 어떻게 해결하면 될까요?캐글도 풀어야한다고 하셨는데 강의 목차 순서에 있는 것일까요?강의 목록에 있는 것들만 완벽하게 숙지하면 시험에 무리없나요? 추가 사이트 들어가서 공부할 필요 없이 이 강의로만 끝내고 싶어서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
실기 강의자료는 어디서 볼 수 있나요?
별도 실기 강의 자료가 있을까요? 인쇄해서 보려구요!