인프런 영문 브랜드 로고
인프런 영문 브랜드 로고

인프런 커뮤니티 질문&답변

자몽몽님의 프로필 이미지
자몽몽

작성한 질문수

빅데이터분석기사 실기대비 (R 활용)

작업형 2유형

작업형 2유형 수업에서

작성

·

25

0

- 학습 관련 질문을 남겨주세요. 상세히 작성하면 더 좋아요!
- 먼저 유사한 질문이 있었는지 검색해보세요.
- 서로 예의를 지키며 존중하는 문화를 만들어가요.
- 잠깐! 인프런 서비스 운영 관련 문의는 1:1 문의하기를 이용해주세요.

 

클래스가 그동안은 2개여서 glm를 사용했는데, 이 문제는 클래스가 4개라서 lda를 사용한다고 수업 중에 나와있습니다. 혹시 어디를 보면 클래스가 4개인지 알 수 있는 걸까요?

이해가 잘 안돼서요...

답변 2

0

companionclub님의 프로필 이미지
companionclub
지식공유자

안녕하세요.

 

lda를 사용한 부분은 제 4회 기출문제 리뷰인데요.

str함수를 사용해서 예측해야하는 'Segmentation' 변수의 형태를 파악하면 알 수 있습니다.

실제 시험에서는 시험문제가 제공되는 좌측의 설명을 보시면 Class의 숫자를 알 수가 있습니다.

 

따라서, 기본적으로 시험문제를 확인하시면 알 수가 있습니다.

(체험환경에서도 동일하게 확인이 가능합니다. (링크)를 여시면 성별을 예측한다고 나와있습니다.)

또한, 제공받은 데이터셋을 로딩해서 str함수를 통해서도 알 수 있습니다.

 

감사합니다.

0

안녕하세요, 자몽몽님. 인프런 AI 인턴입니다.

질문하신 내용은 R에서의 다중 클래스 분석과 관련된 내용으로 보이네요. LDA(Linear Discriminant Analysis)는 다중 클래스를 분류할 때 유용한 방법인데요. 반면, GLM(Generalized Linear Model)은 이진 분류 문제에 주로 사용됩니다.

클래스의 수를 확인하기 위해 가장 많이 사용하는 방법 중 하나는 table() 함수를 통해 레이블의 분포를 확인하는 것입니다. 예를 들어, 레이블이 ‘Segmentation’이라는 컬럼에 있다면 table(train$Segmentation) 코드를 통해 각 클래스별로 얼마나 많은 데이터가 있는지 확인할 수 있습니다. 레이블이 다중 클래스인지 여부를 확인하는데 유용한 도구입니다.

아래에 관련된 답변과 유사한 질문들을 링크로 공유합니다. 참고하시면 도움이 되실 것입니다:

  1. “3개 이상의 분류문제”
    이 게시글에서는 다중 분류 문제를 다루는 방법에 대해 질문하고 있습니다. LDA의 유용성과 GLM에 비해 다중 클래스 분류에 적합한 이유를 설명한 답변을 확인하실 수 있습니다.

저는 질문자님이 이해를 돕고자 지식공유자님의 기존 답변을 참고하여 유사한 답변 링크를 추천해드리고 있습니다. 현재 베타 기능으로 답변이 만족스럽지 않을 수 있는 점 양해 부탁드립니다. 🙏
추가적으로 궁금한 점이 있으시면, 이어서 질문해 주세요. 곧 지식공유자께서 답변해 주실 것입니다.

자몽몽님의 프로필 이미지
자몽몽

작성한 질문수

질문하기