작성한 질문수
[실전]텍스톰 TEXTOM 실전 강의: 빅데이터 논문 작성을 위한 텍스트 분석/텍스트마이닝
25.LDA분석3
작성
·
330
0
Coherence Score가 높을수록, Perplexity score가 낮을수록 좋다고 하셨는데, 왜 토픽수가 2가 아닌 4가 좋다고 하신건가요? Perplexity score는 비슷비슷해보이니까, 확실히 Coherence Score가 높은걸 고르는게 맞지 않나요..?
답변 1
네 안녕하세요. 좋은 질문 주셔서 감사합니다.
적정 토픽수의 범위가 3이상인데요.
일반적으로 LDA분석을 진행할때 3개 이상의 토픽이 나와야 의미적으로 유의미한 토픽이 나오기 때문입니다.
따라서 3 이상의 토픽을 기준으로 해서 coherence와 perplexity 값을 구합니다.
감사합니다.