묻고 답해요
155만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
순위 정보를
불러오고 있어요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
np.log(), np.log1p() 차이
안녕하세요, 예시문제 제3유형 1번문제를 푸는데 로그 함수 사용법에 궁금점이 생겨서 질문드립니다. 로그 변환할 때 np.log()와 np.log1p() 이렇게 배웠던 것 같은데,이 문제 풀 때는 np.log()를 사용하셔서요.두 개중에 어떤걸 사용하는지 기준이 있을까요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 기출 유형(작업형2) 풀이인데 이렇게 해도 될까요?
# 데이터 불러오기 import pandas as pd train = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/5_2/train.csv") test = pd.read_csv("https://raw.githubusercontent.com/lovedlim/inf/refs/heads/main/p4/5_2/test.csv") ytrain = train.pop('price') cols = ['model','transmission','fuelType'] # train = pd.get_dummies(train) # test = pd.get_dummies(test) from sklearn.preprocessing import LabelEncoder for col in cols: le = LabelEncoder() train[col]= le.fit_transform(train[col]) test[col]= le.fit_transform(test[col]) from sklearn.model_selection import train_test_split x_tr,x_val,y_tr,y_val = train_test_split(train, ytrain,test_size=0.2,random_state=2022 ) # from sklearn.ensemble import RandomForestRegressor # rf = RandomForestRegressor(random_state = 2022) # rf.fit(x_tr,y_tr) # y_pred = rf.predict(x_val) import lightgbm as lgb model = lgb.LGBMRegressor(randomstate=0,verbose=-1) model.fit(x_tr,y_tr) y_pred = model.predict(x_val) from sklearn.metrics import root_mean_squared_error result = root_mean_squared_error(y_val,y_pred) submit = pd.DataFrame(y_pred) submit.to_csv('오지욱.csv',index=False) # pd.read_csv('오지욱.csv') # 1324.4944863328471 원핫 랜덤포레스트 # 1320.1181960644112 레이블 랜덤포레스트 # 1271.4972710398029 레이블 lgb -> 선택 # 1282.70065302789 원핫 lgb작업형 2에서 더 어렵게 나오면 그냥 다시 시험친다는 각오로 원핫,레이블 -> 랜포,lgb 경우의 수 4가지 구한뒤 제일 좋은 수치를 가진 모델로 작업해서 제출하고자 합니다. 지금까지로 봐왔을땐 작업형 2는 이정도로만 해도 충분 하겠죠?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
8회 기출 1유형 질문_iloc
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요8회 기출유형(작업형1) 문제풀이 과정 문의드립니다 방문객합계를 구할때 컬럼끼리 더하는 것 말고아래와 같이 진행은 불가한걸까요?아래처럼 작성하면 오류가 떠서요ㅜ df['방문객 합계']=df.iloc[:,1:]
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
인코딩 질문!!
훈련 세트에서 보지 못한 카테고리를 테스트 세트에서 발견하여 아래와 같은 오류가 떴는데 ValueError: Found unknown categories ['XXX'] in column 1 during transform이러한 경우 test에 해당 값을 다른 값으로 대체하거나 삭제 하는게 좋을까요?시험이 얼마 안남아 궁금한게 많네요ㅜㅜ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
encoding시 데이터 병합
범주형 변수encoding시에 무조건 train,test데이터셋 병합 - encoding - 분리 단계로 진행해도 상관없나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
예시문제 작업형3
예시문제 작업형3 번에서 ① 문제 자체가 이해가 안가는데요하나씩 이해좀 시켜주실수 있으실까요? 분산에 차이가 있는지를 알아보기 위해 F-검정을 수행할때 검정통계량의 값을 구하라. var() 함수로 분산을 구한거 이해가 갔어요.근데 F-검정을 수행 할때인데 F-검정을 수행한건가요 풀이에서?? 그리고... 검정통계량을 구하라인데 var2/var1 이 왜 검정통계량이 되는건가요?? 제가 공부하기로 가설검정=t검점분산분석=F검정 으로 알고있엇는데, 문제는 독립표본검정(가설검정) 인데 F검정을 한다고 하니.... 이해가 안가요ㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
Label encoding 시 col 기준
2025 예제 관련해서 작업형 2 에서 label encoding 할 시에 cols 에 데이터를 집어 넣을때 데이터 구분 기준을 잘 모르겠습니다. col 에 다른 인자를 넣게 되면 분명 계산이 잘 안 이루어 지는데 이 계산 인자를 어떤 식으로 구분해서 시험환경에서 적을 수 있을지가 궁금합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
t1-37.purchase-py 소수점 절사
강사님 안녕하세요 새로운 올리신 t1-37.purchase-py 문제2에 관련해서 질문남깁니다.혹시 소수점 절사라고 해서 프리미엄 = df[(df['세그먼트'] =='프리미엄') & (df['카테고리'] =='생활용품')]['구매금액'].mean() 일반 = df[(df['세그먼트'] =='일반') & (df['카테고리'] =='생활용품')]['구매금액'].mean() print(int(프리미엄 - 일반))바로 int()로 했는데 7729가 나와서 혹시 소수점 절사라는 조건 나오면 강사님처럼 int(round())해야하는거죠? 감사합니다
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
유형2 질문!!
유형이 마무리 연습을 하다 의문이 생겨 질문드립니다.random_state 는 필수 일까요?제가 찾아본 지식으로는 실행할때마다 결과가 달라지는 것을 막기 위해 random_state를 쓰는 것 알고 있는데 실제 시험에도 쓰는것이 좋을까요?그리고 사용하지 않았을때 문제되는게 있을까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형2유형 검증데이터분리
작업형 2유형중 검증데이터를 분할할때 기출7을 보면 전체 데이터사이즈는 1000개이고 train = 700 , test = 300입니다 여기서 train_test_split의 test_size를 0.2로한다면 실제 모델이 학습하는 데이터는 560개로 학습하기에는 너무작다고 느껴지고 편향이 있을수 있는데이렇게 문제에서 제시하는 데이터사이즈가 작더라도 train_test_split을 사용해도 될까요??
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
강의 연장(6/18->6/21) 문의드립니다.
선생님 안녕하세요.먼저 좋은 강의 제공해 주셔서 너무 감사드립니다.이번 주 6/21 시험인데, 마침 강의 마감이 오늘 6/18 까지라서 혹시 시험일까지만 강의 연장해 주실 수 있을지 여쭙고자 문의드리게 되었습니다.시험 전 다른 문의들로 바쁘실 텐데 번거롭게 해 드리게 되어 너무 죄송합니다. 문의드릴 때 메일 주소가 필요한 것 같아서 함께 전달드립니다. (ellina0413@gmail.com)확인 부탁드립니다. 감사합니다.
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
7회 기출유형(작업형3) 2-2 문제 질문드립니다
전 아래 코드처럼 작성했는데 정답과 다르게 나오더라구요 어느 부분 때문에 다른 건지 알려주실 수 있을까요?df['CPU'] = df['CPU'] < 100 from statsmodels.formula.api import ols model = ols('ERP ~ Feature1 + Feature2 + Feature3 + CPU',data = df).fit() print(model.summary())
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요rmse를 사이킥런에서 지원하지 않아서, mse로 만들어줘야하는 걸로 알고있는데, 그냥 아래처럼 써도 값은 출력되더라고요. 혹시 이유 알수있을까요? from sklearn.ensemble import RandomForestRegressor rf = RandomForestRegressor(random_state=0) rf.fit(X_tr,y_tr) pred=rf.predict(X_val) root_mean_squared_error(y_val,pred)이렇게 쓰면안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
빅분기 실기체험환경 Warning
2025 예시문제 작업형 2번 풀었습니다.다른건 괜찮은데xgboost 코드 실행시 warning이 뜨네요.아마 version 관련이라 실제 시험환경에서 크게 점수에 좌우되는 부분 아닌 것 같은데 아시는 분 확인 부탁드립니다.
-
미해결[2025년 최신 기출 반영] 빅데이터 분석 기사 실기 시험 100% 합격 ! 기출 문제의 패턴이 보인다 !
6회 작업형 2 문제 1
안녕하세요. 6회 작업형 2 문제 1 영상을 보다 질문 남깁니다.지금까지는 랜덤포레스트 모델을 돌리기 전에 정규화를 했었는데, 이 문제에서는 정규화를 하지 않았습니다. 정규화를 왜 하지 않은 것인가요?
-
미해결[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
1유형과 3유형도 제출 후 수정이 가능한가요?
다시 수정이 가능할까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경 질문이 있습니다..
문제를 풀고 나서 답안지 화면으로 가서 답을 작성할 때 메모장(시험환경)에 작성해둔 것을 보면서 답을 적을 수 있나요? 아니면 문제에 대한 답을 다 외우고 답안지 적는 화면가서 작성해야하나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
데이터 합치기 쪼개기
음, 데이터 전처리 과정에서인코딩할 때,1) 그냥 인코딩 하는 경우2) 데이터를 concat으로 합쳐서 인코딩 하는 경우3) 데이터를 합쳤다가 iloc로 쪼개서 인코딩 하는 경우어떨 때, 위의 경우들이 구분되는지... 예시를 들어주실 수 있나요?ㅠ 자꾸 헷갈리네요..ㅠㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5회 3번, max() 써서 구하는 법 문의
학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!질문과 관련된 영상 위치를 알려주면 더 빠르게 답변할 수 있어요먼저 유사한 질문이 있었는지 검색해보세요아래처럼 여러가지로 해봤는데, 활성화된 코드같은 경우 왜 228을 출력하는지 잘 모르겠어요..ascending=False 안 쓰고, max() 써서 진행하는 방법 설명 부탁드립니다.df['순전입학생'] = df['전입학생수(계)'] - df['전출학생수(계)'] #df.head(3) #가장 많은 학교의 전체학생수를 cond1 = df['순전입학생'].max() #df.sort_values('순전입학생', ascending=False).head(3) #cond1 = df['순전입학생'] == 923 #정수로 출력하시오 print(df['전체학생수(계)'][cond1].sum()) #print(int(df.loc[cond1,'전체학생수(계)'])) #정수로 출력하시오
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
로지스틱 회귀 문제 종속 변수 표현
안녕하세요. 너무 좋은 강의 항상 잘 보고 있습니다. 궁금한 점은..로지스틱 회귀 문제의 경우 결과가 분류로 나오는 것으로 알고 있습니다.model = logit('gender ~ weight', data = train).fit()weight를 독립변수로 하고 gende를 독립변수로 하는 로지스틱 회귀 모델을 만들고,test 데이터의 gender를 예측하는 문제입니다. pred = model.predict(test) > 0.5>0.5 로 명시하지 않으면 1일 확률값이 나오기 때문에 true/false로 나타내도록 하라고 하셨습니다. 궁금한 점은 logit 함수를 만들 때 gender를 범주형으로 명시하지 않아도 되는지입니다.C()로 gender를 묶어보니 에러가 나오더라구요. ㅎ 아직 모르는 게 많아 질문드리니 알려주시면 정말 감사하겠습니다.
주간 인기글
순위 정보를
불러오고 있어요