해결된 질문
작성
·
385
·
수정됨
0
빅데이터분석기사 실기시험 hist 사용이 가능한가요 ? 사용을 못하는 상황에서는 로그적용해볼만한 데이터 분포 확인 쉽게 하는 방법이 무엇이 있을지 궁금합니다
3-6 Regression노트북에서 insurance 데이터셋의 charges 값에 로그를 취하실 때 왼편으로 치우친 것을 확인하신 것 관련 질문입니다
LinearRegression은 모델에 random_state를 안 줘도 계속 5888 이라는 RMSE 값이 나오는 반면에, RandomForestRegressor의 경우, (아마도 모델에 random_state적용이 없어서) 결과가 계속 달라집니다. 혹시 LinearRegression은 원래 그런 특징이 있는 모델인가요??
답변 1
1
안녕하세요!! 아쉽지만 hist()등의 시각화 함수는 사용할 수 없는 환경입니다.
describe()를 보면 간단히는 볼 수 있지만 아무래도 어려움이 있을 것 같아요!
LinearRegression는 선형관계이며 X변수와 y변수 관계를 설명합니다. 선형모델은 random_state 하이퍼파라미터가 없습니다.
RandomForest, rightGBM, Xgboost Regressor는 트리 계열의 모델입니다. random_state가 필요합니다. 랜덤적인 요소가 있어요!
네 특징이 그런것 이 맞습니다.
응원하겠습니다 :)
설명 감사합니다!!