인프런 커뮤니티 질문&답변

김민지님의 프로필 이미지
김민지

작성한 질문수

[퇴근후딴짓] 빅데이터 분석기사 실기 (작업형1,2,3)

모델링 및 평가(회귀)

빅데이터분석기사 실기시험 hist 사용 못하면 분포 확인을 쉽게 하는 방법 궁금합니다

해결된 질문

작성

·

385

·

수정됨

0

  • 빅데이터분석기사 실기시험 hist 사용이 가능한가요 ? 사용을 못하는 상황에서는 로그적용해볼만한 데이터 분포 확인 쉽게 하는 방법이 무엇이 있을지 궁금합니다

    3-6 Regression노트북에서 insurance 데이터셋의 charges 값에 로그를 취하실 때 왼편으로 치우친 것을 확인하신 것 관련 질문입니다

  • LinearRegression은 모델에 random_state를 안 줘도 계속 5888 이라는 RMSE 값이 나오는 반면에, RandomForestRegressor의 경우, (아마도 모델에 random_state적용이 없어서) 결과가 계속 달라집니다. 혹시 LinearRegression은 원래 그런 특징이 있는 모델인가요??

답변 1

1

퇴근후딴짓님의 프로필 이미지
퇴근후딴짓
지식공유자

안녕하세요!! 아쉽지만 hist()등의 시각화 함수는 사용할 수 없는 환경입니다.

describe()를 보면 간단히는 볼 수 있지만 아무래도 어려움이 있을 것 같아요!

 

LinearRegression는 선형관계이며 X변수와 y변수 관계를 설명합니다. 선형모델은 random_state 하이퍼파라미터가 없습니다.

RandomForest, rightGBM, Xgboost Regressor는 트리 계열의 모델입니다. random_state가 필요합니다. 랜덤적인 요소가 있어요!

네 특징이 그런것 이 맞습니다.

응원하겠습니다 :)

김민지님의 프로필 이미지
김민지
질문자

설명 감사합니다!!

김민지님의 프로필 이미지
김민지

작성한 질문수

질문하기