묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
오타인지 궁금하여 질문드립니다.
안녕하세요 좋은 강의를 해주셔서 열심히 듣고있는 학생입니다. 다름이 아니라 수강 중에 궁금한 것이 생겨 질문 드립니다. 강의 분류파트에서 분류 실습 1: 캐글경연대회의 산탄데르 은행 고객 만족 예측 강의 중 약 15:10 경에 LGBM_clf = LGBMClassifier(n_estimators=200) 이라고 적혀져 있습니다. 밑에 gridsearchcv를 수행할 때는 레이블 값으로 lgbm_clf를 넣어 주셨는데요. 혹시 오타로 잘못 기재된것인지 궁금하여 여쭤봅니다. 그리고 16:15 경에 subsample 파라미터가 sumbsample로 입력되어 실행되는 것을 보았습니다. 만약 이게 오타라고 한다면, 파라미터가 오타로 잘못 입력되어도 에러가 안뜨고 적용되어 실행될 수 있는 건지 궁금합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
GridSearch 질문입니다.
안녕하세요 GridSearch 가 어떻게 작동되는지 많이 햇갈려서요 예제코드가 iris data 값들을 파라미터값들인 깊이 와 split 으로 분할해서 학습시키는것이 맞는지요? 그리고 학습시키고 예측은 어느부분에서 실행되는것인지요 감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
균일한 데이터 셋은 그럼 반반인 데이터인가요?
불균일한 데이터셋이라는 게 바로 와닿지가 않네요 4:49
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
안녕하세요 불린인덱싱에대해 질문드립니다
안녕하세요 위 그림과같이 cond1 , cond2, cond3의 조건을 모두 만족하는 행을 뽑아내셨는데 cond1 or cond2 or cond3 와 같은 조건을 한번에 뽑아내는 방법이 있을까요? & 대신 or을 집어 넣어 보았는데 오류가 발생하여 질문드립니다!
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
DecisionTreeClassifier 객체의 random_state 값
의사 결정 트리 클래스 DecisionTreeClassifier 객체를 생성할 때 코드가 dt_clf = Decision_TreeClassfier(random_state=11) 이렇게 되던데요, random_state 값이 왜 파라미터로 필요한지 궁금해요. 이 객체는 이후에 학습 데이터 와 테스트 데이터를 받아서 학습과 예측을 수행하잖아요?? 이 과정에서 학습 데이터와 테스트 데이터가 어떻게 분리되었는지는 알 필요가 없는데 이 값이 왜 들어가나요???
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
공부방법 관련
안녕하세요 강의 잘듣고 있습니다. 머신러닝에 대한 개념이 많이 부족한지라 생각보다 시간이 걸리네요. 공부방법에 관한 질문드립니다. 혹시 코드를 하나하나 다 따라해보며 한줄한줄 다 이해하는게 나을까요 (현재 이런 방식으로 하고있습니다) 아니면 코드의 흐름 및 알고리즘 개념만 이해했으면 넘어가는게 나을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
GridSearchCV 질문드립니다
grid 에서 나온 최적의 하이퍼 파라미터 값이 직접 y_test 히여 정확도를 추출하였을때의 성능 모델 순위에서 낮으면 어떻게 하나요 ? 예를들어서 max_depth = 8로 최적 파라미터값이 출력이 되었는데 y_test 를 가지고 돌렸을시 max_dept =12 인 정확도가 가장 높을때 어떻게 하나요 ?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
임곗값 배열에 대한 질문입니다.
강의 약 9분 44초즈음에 보면 변환된 분류 결정 임곗값 배열의 Shape는 147이고 나머지는 148의 값을 갖습니다. 저의 경우, sklearn 0.23.1 버전으로 돌리고 있으며, 임곗값= 143, 나머진 각각 144로 1개씩 더 많습니다. 보면 (버전의 다름과 상관없이) 임계값의 배열수보다 1씩 더 많은 결과가 발생하는데요, 임계값이 정밀도, 재현율에 비하여 1개씩 부족한 이유에 대하여 알 수 있을까요?
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
강의 slide 공유
강의 slide를 보며 공부하려는데 공유받을 수 있는지 질문드립니다
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
cross val score, gridsearchCV 차이
1. grid가 교차검증과 하이퍼파라미터 튜닝을 동시에 해주는 것이면 cross val score를 또 수행할 필요는 없는것인가요? 또 수행하면 교차검증을 2번하는것으로 이해가 됩니다... 2. 사이킷런 train test split을 적용한 뒤에 또 cross나 grid를 수행하면 데이터를 3가지로 다시 나누는 것인가요? 이런 경우라면 굳이 split을 사용하지 않고 cross나 grid로 처음부터 데이터를 나누면 되지 않나...그런 혼돈이 옵니다...
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
cross_val_score와 GridSearchCV의 차이점이 무엇인가요?
안녕하세요. 현재 선생님의 머신러닝 강의를 수강하고 있는 학생입니다 Section2의 교차검증 성능평가라는 강의를 듣다 궁금한 점이 있어 질문을 올립니다 1. 강의중 하이퍼 파라미터라는 말씀을 하시는데 혹시 하이퍼파라미터라는게 '함수의 계수'라고 생각하면 될까요? 혹시 하이퍼파라미터와 일반적으로 사용하는 파라미터와의 차이점이 있을까요? 2. cross_val_score 메소드와 GridSearchCV메소드의 사용점의 대한 명확한 차이가 궁금합니다. 제가 강의를 듣어 어림잡아 이해한것은 cross_val_score는 메소드 내에서 임의로 파라미터를 설정해 모델을 평가하는 방법이고, GridSearchCV의 경우 사용자가 사용하고 싶은 파라미터 리스트가 존재한다면 해당 리스트 중에서 가장 적합한 파라미터를 추출하는 방법이라고 이해했습니다. 그럼 제가 이해한것이 맞다면, 사용자가 파라미터 리스트가 존재하지 않는다면 cross_val_score 메소드를 사용하는 것이 맞는지요? 1번과 2번의 대한 질문의 답변 부탁드리겠습니다 소중한 강의 정말 감사합니다
-
해결됨[개정판] 파이썬 머신러닝 완벽 가이드
머신러닝 속도 높이는 방법
안녕하세요? 저는 이제 막 머신러닝에 관심을 갖고 공부를 시작했습니다. 한 가지 궁금한 점은 저의 경우 100만개 정도 데이터로 머신러닝을 수행하는 경우도 있을 것으로 예상하는 데 머신러닝 속도를 높이는 방법이 궁금합니다. 배워도 속도 때문에 활용도가 낮아질까 염려되어 미리 질문 드립니다. 좋은 강의 감사합니다.
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
모형에 대한 타당도
선생님 안녕하세요! 강의 잘 듣고 있습니. 선생님께서 roc곡선 같은경우는 회귀보다는 0이냐 1이냐와 같이 분류를 하는 예측모형에서 모형의 타당도를 확인할때 많이 이용된다라고 하셨던 것 같습니다. 그렇다면 이전에 붓꽃을 분류하는 데이터와 같이 결과값이 3종류로 나눠지는 경우는 다른 값을 사용해야하나요? 1,0,2 와 같이 결과값을 구분하였을 때는 강의에서 나온 것 처럼 정밀도 재현율, roc 곡선 같은 것들을 그대로 사용해도 되는 건가요? .
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
feature importance
DT에서 feature importance는 어떻게 결정되는지요? 강의에서는 importance를 확인하는 방법을 배웠는데, 이것이 어떻게 얻어진것인지 궁금합니다.