인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

작성자 없음

작성자 정보가 삭제된 글입니다.

빅데이터분석기사 실기대비 (R 활용)

작업형 2유형

3개 이상의 분류문제

작성

·

174

0

안녕하세요. 올려주신 강의는 짧은 시간에 빅분기 대비에 많은 도움이 되고 있습니다.
 
작업형 2유형에 대한 문의입니다.
분류 모델(또는 회귀모델)에 대한 예시로 caret 패키지의 train함수에서 method = 'glm'과 method = 'rpart'를 사용하는 법을 알려주셨습니다. 다만, 성별과 같은 이항분류가 아니라 3개 이상의 분류에 대한 문제를 풀때도 method = 'glm'이 여전히 유효한지 궁금합니다. glm은 아마도 이항 로지스틱회귀분석 모델이 아닌가 싶어서요. 이때는 random forest 같은 것을 사용해야 할 것 같은데, ntree나 mtry는 어떻게 설정해야 할지요?

답변 1

0

companionclub님의 프로필 이미지
companionclub
지식공유자

안녕하세요.

두 개를 초과하는 클래스를 가지는 모델에 대해서

여쭈셨는데요. 제가 소개해드린 방법은 이진분류에

대해 유효한방법입니다. 그것을 초과하는 경우는

다른 모델링 방법이 필요하며 그건 강의 범위를

초과할 것 같습니다. 다만, 빅데이터 실기시험 수준

을 봤을 때 분류문제는 이진분류수준에서 출제될 것이

라고 판단됩니다. 기본적인 랜덤포레스트 역시 

이진분류에 유효하며 그때 mtry ntree는 caret의

랜덤서치와 그리드서치를 이용해서 파라미터 튜닝을

하게됩니다. 하지만 그럴경우 전체 코드실행시간이 

1분을 넘을수있어서 0점처리가 될 수있으니

추천드리지않는 방법입니다. 감사합니다.

 

작성자 없음

작성자 정보가 삭제된 글입니다.

질문하기