묻고 답해요
141만명의 커뮤니티!! 함께 토론해봐요.
인프런 TOP Writers
-
해결됨[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)
머신러닝 회귀 모델 반복 실행할수록 값 바뀜 현상
# RandomForestRegressor from sklearn.ensemble import RandomForestRegressor model = RandomForestRegressor() model.fit(X_tr, y_tr) pred = model.predict(X_val) rmse(y_val, pred)머신러닝 회귀 모델에서스케일링 해둔걸 주석처리하고 이전 셀 실행 후 위 코드를 실행해서 베이스라인 값을 체크하려는데,강의와 다른 값이 나와서 한번 더 실행했더니 값이 또 바뀌는데 원인이 뭘까요?이후에도 계속 실행할수록 값이 매번 바뀝니다!
-
미해결[개정판] 파이썬 머신러닝 완벽 가이드
머신러닝 모델 선택 방법
안녕하세요 강사님.강사님의 강의를 토대로 kaggle, dacon에서 제공하는 데이터를 가지고 분석을 하면서 궁금한 점이 생겼습니다.데이터를 예측할 때 가장 좋은 모델을 비교를 하지 않고 선택할 수 있는 방법이 있을까요?예를 들어 분류에서는 boosting 알고리즘에서도 XGBoost, LightGBM, CatBoost 등 여러 모델이 있는데 이 중에서 가장 좋은 모델 즉, 해당 데이터 셋에서 가장 적절한 모델을 찾을 수 있는 방법이 있을까요??데이터의 크기가 현재는 모든 모델을 사용하면서 성능을 비교할 수 있는 크기지만, 나중에는 매우 많은 데이터를 다루게 된다면 비교하기에 어려울 것 같다는 생각이 들어서 이렇게 질문을 남깁니다.
-
미해결
트랜스포머 모델 언어 변경
안녕하세요!영어로 학습된 모델을 한글로 파인튜닝 시킬 수 있을까요?현재 영어로 된 그림을 텍스트로 변환하는 (비전) 트랜스포머 모델이 있습니다. 이 모델의 기능을 똑같이 한국어에서도 작동되게 모델을 파인튜닝 시키려고 하는데 가능한 작업일까요?생각해 본 방법은 먼저 모델에 한국어 토큰들을 추가한 후 한국어 그림 -> 텍스트 데이터셋으로 학습을 시키는 것인데 다른 방법들이 있는지도 궁금합니다!혹시 이런 상황 경험 있으신 분이나 다른 조언들도 감사히 받겠습니다.
-
미해결스프링 MVC 2편 - 백엔드 웹 개발 활용 기술
Regions 필드의 값이 추가되는 동작방식이 궁금합니다!
강의를 통해 열심히 배우고 있는 학생입니다 이번에 여쭤보고싶은게 있어 질문했습니다. 다중 체크박스에서 서울과 부산을 선택해서 상품 수정시 폼 데이터 전송 방식까지 확인 했습니다. 또한Item 클래스에서 regions 필드는 List 타입으로 선언되어 있으며 @Data 애노테이션으로 롬복이 getter sertter 등을 자동 생성해준다고 학습했습니다. 여기서 궁금증이 생겼습니다. 컨트롤러에서 @ModelAttribute를 사용할 시 Item 타입의 객체를 생성하고 객체의 프로퍼티까지 셋팅해주며 그 방식이 폼 데이터로 넘어온 name 값으로 setter를 호출한다고 알고있는데 list 타입으로 선언한 regions의 setter호출시 자동으로 값을 넣어주는 기능을 하는건가요?? Item 객체의 regions 필드에 Seoul, Busan과 같은 값이 어떻게 추가 되었는지 궁금합니다.
-
미해결<M.B.I.T> 테스트 페이지 만들기! with Django
강의내용을 바탕으로 새로운 것을 만들려고 하고 있습니다.
강의와는 약간 다르게 실제 MBTI 검사페이지를 만들어 보려고 하는데, 모델에서 강의는 개발자 유형의 베스트를 뽑아서 결과페이지에 도출했다면, MBTI 검사는 I/E , S/N 등 나눠져있는데 이걸 어떻게 도출해야 할 지 의문입니다. 모델은 E,I,S,N 등 총 8개를 만들었습니다.
-
미해결[개념부터 실습까지] 추천 시스템 입문편
[강사님] Content_based가 이게 맞나요?
추천시스템 관련 리서치를 해보았는데, 여기서 안내해주시는 모델은 (현재 content-based recommendation1까지 들음) 사실상 Collaborative Filtering이 아닌가 싶네요? Content-based는 말그대로 글, 이미지 같은 정보들을 벡터화하고 유사도 측정해서 가장 비슷한 정보를 찾는 방식으로 이해하고 있는데... 혼란스러워서 답변 주시면 감사하겠습니다.