묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
스태킹 모델 메소드의 교차검증
안녕하십니까 선생님 좋은 강의 수강하고 부족한 부분에 대해 강의를 여러번 돌려보고 있습니다.다름아니라 제가 Stacking 앙상블 학습에 관심을 갖고 공부를 진행하고 있는데 sklearn에 StackingRegressor 메소드(?)를 이용한 코드를 작성해 봤습니다. 아래는 작성한 코드 중 메소드 부분입니다.Stacking = StackingRegressor(estimators=estimators, final_estimator=meta_model, cv=10)여기서 cv=10을 이용하면 강의 예시에 나오던 stacking_input_data 함수 정의에서 n_folds를 10한것과 같은 과정으로 이루어지는건가요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
맥북 에어 m1 lightgbm 설치가 안되네요 ..
안녕하세요 맥북 에어 M1칩을 사용하고 있는 학생입니다. 다름이 아니라 brew install lightgbm, pip install lightgbm(주피터에서) 해도 이미 설치가 되있다고 뜨지만주피터에서 import lightgbm을 하면 오류가 뜹니다 오류 내용은OSError: dlopen(/Users/choeyuhyeon/opt/anaconda3/lib/python3.9/site-packages/lightgbm/lib_lightgbm.so, 0x0006): Library not loaded: '/usr/local/opt/libomp/lib/libomp.dylib' Referenced from: '/Users/choeyuhyeon/opt/anaconda3/lib/python3.9/site-packages/lightgbm/lib_lightgbm.so' Reason: tried: '/usr/local/opt/libomp/lib/libomp.dylib' (no such file), '/usr/local/lib/libomp.dylib' (no such file), '/usr/lib/libomp.dylib' (no such file)다음과 같고 https://github.com/Microsoft/LightGBM/issues/1369여기서 나오는 코드를 그대로 사용해봐도 똑같은 상황입니다. 어떻게 해야될까요..? 윈도우 노트북을 새로 사야되나요..
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
Colab를 통한 실습 관련 질문드립니다.
안녕하세요,강의 내용을 Colab를 통해서 실습을 하고 있습니다. 다른 코드를 실행 할때는 별 문제가 없었지만, 산탄데르 은행 데이터셋과 사기검출 데이터셋을 실행할때read_csv를 통해 csv파일을 읽어오면 실행 할때마다(런타임이 바뀔때 마다) read된 결과가 다른데 왜 그런지 알 수 있을까요? 사기검출 데이터의 경우 25838 rows × 31 columns 로 읽히는 경우도 있고, 39702 rows × 31 columns로 읽어지는 경우도 있습니다. 두 데이터셋다 공통적으로 Nan 값도 생기기도 하네요. 런타임을 몇번 초기화 하다보면 운좋게(?) 정상적으로 읽어지는 경우도 있습니다. 왜 실행할때마다 결과가 다르게 나오는지 궁금합니다!
-
미해결인공지능 기초수학
강의 교안 부탁 드립니다.
안녕하세요 수강신청하여 강의 듣고 있습니다.강의 교안 부탁 드립니다.chg9309@naver.com감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 문의드립니다.
안녕하세요! 선생님 개설 강의중에 스파크로 배우는 머신러닝 문의드립니다.사내에서 데이터분석을 위해 파이썬과 파이스파크를 이용중인데,파이스파크 사용법에 익숙치 않습니다.. 선생님의 위 강의가, 파이스파크 강의인지 궁금합니다.감사합니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
DataConversionWarning 오류
안녕하세요 맥 환경에서 머신러닝 공부중입니다.현재 맥북프로로 M1 pro칩 기반에서 작동 중에3분 30초에 GridSearchCV 작동부분에서 아래와 같은 오류가 발생합니다.DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples,), for example using ravel().n_jobs = -1로 설정하였을 때는 결국 timeout으로 빠져 작동 정지 됩니다.아마 cpu환경이 M1과 다르기 때문에 생기는 오류라고 생각되어 n_jops=2, 4, 8 ,10으로 설정하여 가동을 시켰습니다.n_jops를 변경하면 값이 결과값이 나오지만, 여전히 DataConversionWarning이 나옵니다.왜 그런지 알 수 있을까요?(사진 함께 첨부합니다.)
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
pca / LDA 차원축소 질문
선생님 차원축소 부분을 공부하다가 개념이 헷갈리는 부분이 있어서 질문드립니다...제가 이해한 바로는 차원 축소는 피처의 개수를 줄이는 것 보다는 차원 축소를 통해 데이터를 잘 설명할 수 있는 잠재적인 요소를 추출하는게 목적인데 그러면 코드상에서 저렇게 차원축소로 fit transform 한 결과로 나오는 저 두 숫자들이 의미하는 바가 무엇인지 이해가 잘 안됩니다. 저렇게 2차원으로 차원 축소를 시켜서 나오는 2개의 피처들이 의미하는게 새로운 축? 이라고 이해해야 하나요..? 저 각각의 lda_component들이 무엇을 의미하는지가 이해가 잘 안됩니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
get_feature_names()에 대한 질문
안녕하세요 선생님. 선생님 강의를 열심히 듣고 있는 수강생중 한명입니다. 다름이 아닐 강의 내용중 count_vect.get_feature_names()는 단어들이 나오는데feat_vect.get_feature_naems()는 안되는 이유가 있을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
아이템 기반 인접 이웃 협업 필터링 실습 내용 중
아이템 기반 인접 이웃 협업 필터링 실습 내용 중 문의드립니다. 28:16에서 확인가능한 최종 9번 사용자에 대하여보지않은 영화 중 예측평점이 높은 영화 10개를 추천해주는 결과에서 1위 Shrek은 pred_score가 0.866202로 확인됩니다.실제 평점범위가 0보다 크며 가장 큰 값은 5인데추천되는 영화의 예측평점이 너무 낮은건 아닌지요?pred_score가 나올 수 있는 값의 범위와 의미가 궁금합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
분류 결정 예측 확율
분류 결정 예측 확율은 Classifier내부에서 자체적으로 t, z, x^2 등의 분포를 통해 나타내는 지표인가요
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
Confusion Matrix and Type Errors
Confusion Matrix 의 FN 과 FP 는 혹시 Statistics 학문에서의 Type I Error 와 Type II Error 인가요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
titanic_df['Cabin'].str관련 에러
안녕하세요 선생님, 다름이 아니라 타이타닉 생존자 예측1 강의를 복습하다 코드에 에러가 생겨 질문드립니다. titanic_df['Cabin']에서 첫 번째 문자열만 가져오기 위해서 titanic_df['Cabin'].str[:1]을 실행하였으나 'PandasArray' object has no attribute '_str_getitem' 라는 에러가 나왔습니다. 해당 에러를 고치기 위해 어떻게 코드를 수정해야 하는지 혹은 어떤 다른 방법으로 조치해야 하는 지 여쭙기 위해 질문드립니다.
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
강의 4:02 부분 vectorizer 질문
안녕하세요 선생님. 먼저 좋은 강의 감사합니다.다름이 아니라, feature vectorization 부분 관련 질문이 있어 이렇게 글을 씁니다.강의 4분 정도에 name은 CountVectorizer를 쓰고 item_description은 상대적으로 길어서 TfidfVectorizer를 쓴다고 하셨는데,그렇다면 해당 데이터셋이 아닌 다른 데이터셋에 적용할 때도 컬럼의 길이가 상대적으로 짧으면 CountVectorizer, 상대적으로 길면 TfidfVectorizer를 써야된다고 이해를 해도 괜찮을걸까요?감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
스태킹 모델의 메타모델 매개변수에 따른 예측값 변화
안녕하십니까.얼마전에 스태킹 알고리즘 문제로 좋은 답변을 받고 해결하였습니다. 추가적인 질문이 있어 글 남깁니다. 스태킹 모델의 메타모델로 Ridge회귀를 사용하였는데 Alpha 값의 변화에 따라 예측 값의 변화가 전혀 없어서 왜 변화가 없는지 이해가 안되어 글 남깁니다. Alpha 값을 0.001, 0.01, 0.1, 1등으로 설정하여 예측을 수행했는데 예측 값의 변화가 전혀 없었습니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
LemNormalize 함수 관련 질문
안녕하세요 선생님. 먼저 좋은 강의 감사드립니다.함수 관련 질문이 있어 드리게 되었습니다. remove_punct_dict = dict((ord(punct), None) for punct in string.punctuation)def LemNormalize(text): return LemTokens(nltk.word_tokenize(text.lower().translate(remove_punct_dict)))여기에서 .translate(remove_punct_dict) 부분이 잘 이해가 되지 않아 질문을 드립니다! 이 부분이 stop_words를 제거하는 코드라는 것은 이해했으나, 어떻게 작동하는지 궁금하여 질문을 드립니다.감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
복습 방법 문의드립니다.
먼저 열정적인 강의에 감사드립니다.이번 강의 Accuracy편을 보면,class도 호출하고 함수도 많이 정의하고, 정의도 복잡하고..ㅎㅎ 먼가 뒤로 갈수록 코딩이 더 어려워지고 있다는게 느껴집니다.복습과 공부 방법을 어떻게 가져가면 좋을까요?외우는거 말고, 그냥 계속 한줄한줄 이해하면서 하는게 가장 빠른 길일까요?조언좀 부탁드립니다..
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
스태킹모델 예측성능 올리는 법
안녕하십니까.수업을 듣고 연습을 하던 중 문제가 생겨서 글 남깁니다.제가 Random Forest, LGBM으로 기기의 출력을 예측하는 과정을 하고 있는데 각각 단일 앙상블 학습보다 RF와 LGBM을 조합한 스태킹 학습을 통해 예측 성능을 높이려고 했는데 단일 앙상블 학습의 예측 성능이 MAE기준 1점 정도 더 높게 나왔습니다. 스태킹 학습을 통해 성능을 살짝만 올리면 원하는 목적에 달성할 수 있을 거 같은데 어떻게 하면 좋을까요?현재 RF, LGBM, XGB, Linear 회귀 알고리즘을 조합하여 도전을 해봤는데도 예측성능이 오르질 않네요 ㅠㅠ
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
Series와 Print 질문
타이타닉 csv파일을 불러올때 변수명을 print문으로 출력해서 가져오면 Series로 값이 출력되고그냥 변수명을 입력에서 출력하면 dataframe 형태로 가져오던데 왜 다른거죠 궁금하네요
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
선형회귀 모델을 위한 데이터변환
안녕하십니까! 선생님선형회귀 모델을 위한 데이터 변환에서 스케일링을 한 데이터에 다시 다항 특성을 적용하여 변환을 적용해준다고 하셨는데 , 이때 다항 특성을 적용하는 이유가 다항 회귀 곡선으로 표현한 것이 더 예측성능이 높기 때문에 적용을 해주는 것인지? 또 다항 특성을 적용했을 때 무조건 성능이 올라 가는 것이 아니라 과소적합이나 과대적합의 위험성도 있는지 궁금합니다!
-
미해결인공지능 기초수학
강의교안 부탁드립니다
수강신청하였습니다! 강의교안 부탁드립니다. rhaxodl1104@gmail.com