작성
·
346
답변 1
0
안녕하세요
일단은 N-gram을 도출하는 기준은 빈도수가 높은 기준으로 해서 도출을 하고
상위 몇개까지 도출하는 것을 결정하는 것은
시각화시에는 화면에 잘 나타낼 수 있는 범위로하며
데이터를 표로 나타낼 경우에는
적게는 10위, 많게는 30위까지 나타내는데, 표 데이터에 대한 도출근거는
데이터의 분석 목적에 맞는 주요 N-gram 단어들을 나타낼 수 있는 상위 단어 기준으로 한다고 보시면 될 것 같습니다.
이진규 드림