묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
인코딩 질문입니다..
이와 같이 mode 변수의 클래스 수가 다른데...ct = make_column_transformer((OneHotEncoder(sparse=False), col_cat), (StandardScaler(), col_num))ct.fit(X)X = ct.transform(X)X_te = ct.transform(X_te)print(X.shape)print(X_te.shape)이것을 적용하니...(7468, 37) (3200, 37) 이렇게 컬럼이 동일해졌습니다... make_column_transformer가 컬럼 수를 맞춰주는 기능도 있나요? 이해가 잘 안갑니다..ㅠㅠ
-
해결됨실리콘밸리 엔지니어와 함께하는 Apache Airflow
섹션1 apache airflow 설치하기 질문
강의 3:17 에서"그대로 카피하셔서 설치하면" 이라고 하셨는데 이게 무슨뜻이죠? 구체적인 방법을 알려주시면 감사하겠습니다.카피해서 터미널에 붙여넣기를 하면 오류가 떠서요
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
rmse(np.exp(y_val),no.exp(pred)) 작업시 나오는 에러메세지 해결 방법
rmse를 진행하는 부분에서rmse(y_val,pred) 라고 진행하면 문제가 없으나후에 y값에 들어갈 charges 컬럼 데이터에 로그를 씌워 단위 변환한 평가값과 비교하기 위해기존 데이터 평가에 rmse(np.exp(y_val),np.exp(pred))를 씌워보면Found input variables with inconsistent numbers of samples: [161, 268] 혹은Input contains infinity or a value too large for dtype('float64').와 같은 에러가 뜹니다. 혹시 제가 어떤 작업을 놓친 걸까요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
최대 최소 스케일링과 , test.pop
스케일링과 test.pop 코드는 반드시 사용해야하나요?저는 스케일링과 cust_id에 대한 test.pop을 안쓰고 모델링을 했는데 저처럼 해도 괜찮나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
다중분류 확률값 제출에 대해서 질문드립니다!
안녕하세요 선생님 계속 질문드려서 죄송합니다. 다름이 아니라 pred_proba를 test 데이터에 적용하고 제출할때 오류가 발생해서 질문드립니다.y_val_dumm = pd.get_dummies(y_val) pred_proba = model.predict_proba(X_val) print(roc_auc_score(y_val_dumm, pred_proba, multi_class = 'ovo')) ####마지막 제출!! pred_proba = model.predict_proba(test) pd.DataFrame({'id':test_id, 'Seg':pred_proba}) "Per-column arrays must each be 1-dimensional" 오류가 발생합니다. pred_proba의 컬럼을 지정 안해줘서 그런거 같은데 마지막 제출은 어떻게 해야 하나요??
-
해결됨빅데이터 파이프라인 마스터; 성공을 위한 도구와 기술
Selenium을 통해 LinkedIn 제어 및 Job 지원하기 실습2
안녕하세요. 강의 잘 듣고 있습니다. 영상찍은 시점과 제가 실습하는 시점이 달라서 그런 것 같은데 실습하는 중에 자동 로그인 까지는 했는데 그 이후에 간단한 보안 인증이 뜨면서 직접 그림을 맞춰야만 다음 단계로 넘어가집니다. 이러한 과정을 생략할 수 있는 방법이 있을까요? 그리고 그림 맞춘 후 지원하기 요소를 찾을 수 없다고 이러한 오류가 발생합니다. NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector","selector":".jobs-apply-button--top-card"} (Session info: chrome=118.0.5993.117)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
5-2 작업형 문의
name, host_name은 둘다 3만이 넘는 고윳값 때문데 삭제하는 건 알겠는데 host_name은 9943개인데 삭제하는 이유를 알 수 있을까요? latitude, longitude 얘네는 host_name보다 고윳값이 많은데 삭제하지 않는 이유는 수치형 데이터여서 그런가요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
라벨 인코더할 때 le = LabelEncoder() 구문을 반복하는 이유가 있나요?
라벨 인코더할 때 le = LabelEncoder() 구문을 반복하는 이유가 있나요?for 문 밖에서 한번 만들어 놓고 계속 쓰면 안되나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-3 수업에서 이상치를 제거할 때
X_train = X_train[X_train['age']>0] 위의 코드를 사용해서 이상치를 제거하게 되면 나중에 3-5에서 머신런닝을 시킬때 X_train과 y_train의 길이가 불일치되서 오류를 유발하지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
3-5 Classification 수업에서요.
왜 처음부터 데이터를 train_test_split 로 나누고 시작하는게 아니라 마지막에 왜 데이터를 나누어서 다시 시작하는 건가요? train_test_split으로 나누지 않고도 X_train과 y_train만으로도 predict_proba는 적용할 수 있지 않나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
numpy 함수에 대해 질문드립니다 선생님...!!
제가 아직 개념이 완전히 잡혀있지 않아서 생기는 궁금증인것같습니다.. import numpy as np 를 하면 numpy 라이브러리를 불러오는걸로 알고있는데요! 그럼 도대체 언제 이 라이브러리를 불러오는건지 정해져있는게 있을까요?어떤 상황에서 불러와야된다...이런게 있는지 궁급합니다.예제 문제들을 풀고있는데 표준편차의 절대값 차이를 출력할때도 numpy를 불러와서 np.abs(a - b) 이렇게 쓰던데...언제는 쓰고 언제는 안쓰는건지 이런 개념이 궁금합니다 ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
이번에는 스터디 안하는지 궁금합니다!!
이번에는 스터디 안하는지 궁금합니다!!
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
시험환경에서 적용했을 때 결과가 잘려서 보입니다 ㅠㅠ
시험환경에서 적용했을 때 결과가 잘려서 보입니다 ㅠㅠ 아래와 같이 예측구간만 나오고 신뢰구간을 확인할 수 없을 때 모두 보고싶으면 어떻게 하나요 ???
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
수업노트, 링크첨부가 안보입니다
데이터 분석을 위한 파이썬 기초1에서 수업노트에 링크를 첨부해두었다고 하셨는데 수업노트는 어디에 있나요?수업노트,링크를 찾을 수 없습니다.F&Q에서는 화면 오른쪽 상단에 초록색으로 구름모양 아이콘이 있는데 이 강의에서는 찾을 수 없습니다
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 1 - 문제 2 질문있습니다.
강사님.. ㅎㅎ 제가 또 작성했는데 결과값이 다르게 나와서요 ㅜㅜ 한번 검토 부탁드립니다!!제 결과값은 79가 나왔어요! 정답은 56이구요!!# your code import pandas as pd import numpy as np df=pd.read_csv('members.csv') # df.head() # 주어진 데이터에서 결측치가 30%이상 되는 컬럼을 찾고 해당 컬럼에 결측치가 있는 데이터(행)를 삭제 함. # print(len(df)) # 100 # 결측치가 30% 이상 = 30개 이상 # print(df.isnull().sum()) # f1 - 31개 , f3 -28개, views-4개 확인 # 따라서 f1은 결측치 있는 행 제거, f3은 최빈값으로 값 대체 df['f1'] = df['f1'].dropna() df['f3'] = df['f3'].fillna(df['f3'].mode()[0]) cond = (df['f3'] == 'gold') ans = len(df[cond]) print(ans)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
작업형 1 모의문제 1-문제 1 질문있습니다.
제가 코드를 이렇게 작성했는데 강사님의 답은 3261이고 제 답은 3661입니다.코드를 보면 강사님의 코드와 동일한 결과값이 나와야하지않나..하고 생각이 드는데 어디가 틀렸는지 한번 검토 부탁드립니다.!!# your code import pandas as pd import numpy as np data = pd.read_csv('members.csv') data.head() # f1 컬럼 결측치 중앙값으로 대체 f1_median = data['f1'].median() data['f1'] = data['f1'].fillna(f1_median) # 나머지 결측치 있는 데이터 모두 제거 data = data.dropna() # print(data.isnull().sum()) # 앞에서부터 70% 데이터 중 views 컬럼의 3사분위 수에서 1사분위 수를 뺀 값을 구하시오 (단, 데이터 70% 지점은 정수형(int) 변환) view70 = int(len(data)*0.7) # print(view70) data = data.loc[:view70] Q3 = data['views'].quantile(0.75) Q1 = data['views'].quantile(0.25) ans = Q3 - Q1 print(ans)
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
전처리 질문입니다.
데이터 스케일링과 인코딩을 위해 make_column_transformer를 사용하고 샆은데,혹시 이것을 사용하면 문제가 될 것이 있을까요? 그리고, 통계쪽에서, stats_models까지 준비해야 할까요?.. 아직 공개된 패키지에는 없어 보이는데..시간은 없는데 할게 많다보니...ㅠㅠ
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
판다스 똑같이 코드를 넣었는데 이렇게 뜨면 뭐가 문제인가요?
(사진)
-
미해결TEXTOM SV로 해보는 빅데이터 분석 (정제부터 시각화까지)
화면 확대
화면을 확대해서 볼 수 있나요?
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
피처 엔지니어링 관련 질문
안녕하세요 선생님!train, test 데이터를 합치고 인코딩 후 분리하는 과정에서line = int(X_train.shape[0])이라고 하셨는데 이 부분이 이해가 안갑니다! X_train.shape이 (29304, 15)일 때 int(X_train.shape[0])는 29304(데이터 수)를 말하는 것일까요?